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Using Womb Grammars for Inducing the Grammar of 
a Subset of Yorúbá Noun Phrases 


IFE ADEBARA* 
Simon Fraser University, Burnaby, Canada 


Abstract. We address the problem of inducing the grammar of an under-resourced language, 
Yorúbá, from the grammar of English using an efficient and, linguistically savvy, constraint 
solving model of grammar induction —Womb Grammars (WG). Our proposed methodology 
adapts WG for parsing a subset of noun phrases of the target language Yoruúbá, from the 
grammar of the source language English, which is described as properties between pairs of 
constituents. Our model is implemented in CHRG (Constraint Handling Rule Grammar) and, 
it has been used for inducing the grammar of a useful subset of Yorúbá Noun Phrases. Interest- 
ing extensions to the original Womb Grammar model are presented, motivated by the specific 
needs of Yorúbá and, similar tone languages. 


Keywords: property grammars, constraint handling rules grammar, constraint handling rules, 
womb grammar, computational grammar, syntax, grammar induction, Yorúbá. 


1 Introduction 


Grammar induction is a data driven approach to learning grammars, and, analyzing 
languages. 


* Author's address: 
Department of Computing Science 
Simon Fraser University 
8888 University Drive, Burnaby, Canada 
E-mail iadebaralsfu.ca 
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We adopt a novel grammar induction technique, called, Womb Grammars (WG), 
developed by Dahl and Miralles (2012a). WG employ a property based methodology, 
which, relies on the grammar of a source language to induce the grammar of a target 
language. WG assume that the grammar of the source language is correct and, that 
the lexicon and, input phrases of the target language are correct and, representative of 
a fragment of noun phrases in the target language. It adopts a constraint-satisfaction 
approach whereby input phrases of the target language are tested for satisfaction and, 
unsatisfied constraints provide a lead for the reconstruction of the target grammar 
using the source grammar. We use a context free grammar of the target language to 
evaluate the correctness of our parser. 


In this paper, WG are used to induce a/the grammar of a subset of noun phrases 
in Yorúbá, from that of an English grammar with same coverage (Dahl 8 Miralles 
2012b). We use English as our source language and, Yorúbá as the target language. 
English was chosen as the source language for various reasons, especially because, 
it is a language the author can speak and, write fluently. English also has a wide au- 
dience, and, we believe that it will be easier for a wider audience to understand the 
WG model using a language: English, whose structure is well known. Using a well 
known language eliminates the need for the reader to in addition to understanding the 
WG model, learn and, understand the structure of two less known languages (Source 
and target languages). Also, because English is a language which has been well stud- 
1ed by linguists, many linguistic resources are available and, easily accessible, and, 
this made creating a correct property grammar (details in section 4.1) easier than 
using any language which has less resources easily accessible. The author's formal 
training in linguistics and, native speaker competence in Yorúbá also made Yorúbá a 
desirable language as the target. Since we need a correct grammar of both the source 
and, target language, English and, Yorúbá languages were thus, the most accessible 
languages for this task. In fact, the success achieved from using English to induce the 
grammar if Yorúbá, reveals that, it is possible to use WG for any pair of languages, 
including unrelated languages, although with some modifications. 


The novel approach of WG, needs neither a pre-specified model family, nor, parallel 
corpora, nor any of the typical models of machine learning, and, works for more than 
just specific tasks such as disambiguation (Dahl $z Miralles 2012a). It automatically 
transforms a given (task-independent) grammar description of a source language, 
from just the lexicon of the target language, and, a representative input set of correct 
phrases in the target language. The syntactic descriptions of the source and, the target 
language subset addressed are stated in terms of linguistic constraints (also called 
“properties” in linguistic literature) between pairs of constituents, although for the 
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target language constraints we depart from the classic formalism (Blache 2004) in 
view of Yorúubá motivated extensions. This allows us a great degree of modularity, in 
which constraints can be checked efficiently through constraint solving. 


Using linguistic information from one language to describe another language has 
yielded good results, however, it was used for tasks like disambiguating the other 
language (Burkett 82 Klein 2008), fixing morphological or syntactic differences by 
modifying tree-based rules (Nicolas ef al. 2009), and, not for syntax induction which 
1s our focus. The approach adopted usually requires parallel corpora, although, there 
exists an exception (Cohen Smith 2010) where a bilingual dataset is used to train 
parsers for two languages simultaneously. This is accomplished by tying grammar 
weights in the two hidden grammars, and, is useful for learning dependency structure 
in an unsupervised empirical Bayesian framework. 


Our results in applying and, adapting the WG framework for inducing Yorúbá noun 
phrases show that this model compares favourably with others in solving the gram- 
mar induction problem: it combines linguistic formality with efficient problem solv- 
ing, and, can transfer into other languages, including languages in which tones have 
a grammatical and, or, semantic function. 


2 Motivation 


Language endangerment and, death has been of serious concern in linguistics and, 
language policy making. Close to seven thousand languages are currently spoken 
in the world, the majority of which are understudied and, endangered. It has been 
said that an alarming 50 to 90 percent of languages will be extinct by the end of the 
century (Romaine 2002). 


For various reasons, some speakers of many minor, less studied languages may learn 
to use a different language from their mother tongue and, may even stop using their 
native languages. Parents may begin to use only that second language with their 
children and, gradually the transmission of the native language to the next generation 
1s reduced and, may even cease. As a result, only the elderly in such communities 
may use the native language, after a while, there may be no speakers who use the 
language as their first or, primary language and, eventually the language may no 
longer be used at all. Thus, a language may become extinct, existing perhaps only in 
voice recordings, written records and, transcription and, languages which have not 
been adequately documented completely disappear. 
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Linguists cannot keep up with the study of the endangered languages even for ed- 
ucational purposes, and, there is a growing need for their automatic processing as 
well, since the amount of text sources grows much faster than humans can process 
them. To make matters worse, most linguistic resources support English and, a hand- 
ful of other “first world” languages, leaving the vast majority of languages and, di- 
alects under-explored. Clearly, automating the discovery of an arbitrary language”s 
grammar model would render phenomenal service to the study and, preservation of 
linguistic diversity. 


Scientifically, we explore to what extent the parsing-as-constraint-solving paradigm 
of natural language processing problem solving could achieve a great degree of lin- 
guistic, descriptive formality without sacrificing efficiency, in the realm of grammar 
induction, and, in particular for inducing Yorúbá, which is severely under-resourced 
and, endangered. 


3 The Yorubá Language 


Yorúbá belongs to the Yoruboid group of the Kwa branch of the Niger-Congo lan- 
guage family, which cuts across most of sub-Saharan Africa. It is a tonal dialect- 
continnum comprising about 20 distinctive dialects and, spoken by over 30 million 
people in the western part of Nigeria (Fagborun 1994). Niger-Congo is the largest 
of the five main language families of Africa. The others being Nilo-Saharan, Afro- 
Asiatic, Khoisan and, Austronesian (mainly found in the nation of Madagascar). 


Yorúbá is one of the three regional (national language contained in the constitution) 
languages in Nigeria and, is said to be the most studied African language. Yorubá is 
spoken by more than 20 percent of 170 million people who make up the population 
of Nigeria (the largest single black nation on earth). The two other national lan- 
guages are Hausa and, Igbo, both of which are also regional languages in the north 
and, southeastern parts of the country respectively. The Yorúbá language is a koine 
(Fagborun 1994), a process involving dialect mixing, levelling, and, simplification 
(Trudgill 1986). Standard Yorúbá which can also be referred to as the standard koine 
is a compendium of several dialects, mainly dialects of Oyó, Ibádan, Abédkúta, and, 
Lagos, which were major trade centers of early Church Mission Society missionary 
activities. 


Apart from the standardized koine, there are twenty other dialects of Yorúbá: Oyó, 
ljésa, Há, Ijebú, Ondó, Wo, Owe, Jumu, Iworro, Igbonna, Yagba, Gbedde, Egbá, 
Akono, Aworo, Bunu (Bini), Ekiñ, Haje, Ikále, Awori. These dialects are largely 
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mutually intelligible, albeit with some variations in vocabulary and, phonology and, 
were largely spoken by different groups of people who, though tracing their descent 
to their common progenitor (Oduduwa), do not consider themselves as one peo- 
ple. Although there are several dialects of Yorubá, it is important to mention that 
the present research is based on the “standard” Yorúbá. This is because, “standard” 
Yorúbá is the only variety referred to as Yorúbá and, the only variety taught in schools 
in Yorubá land and, diaspora. It is the language of the media and, of official govern- 
ment business. It is described as a resource scarce language (Adeyanju et al. 2015) 
due to the limited number of texts available in Yorúbá. 


3.1 The Sociolinguistic Situation of Yorúbá in Nigeria 


Despite the seemingly large population of Yorúubá speakers, according to Bámgbósé 
(1993) it is a deprived language. Yorúbá has also been classified as a seriously en- 
dangered language (Fabunmi $ Salawu 2005). This is according to Wurm (1998) 
who categorises language status into: 


(1) potentially endangered - there is a decline in the use of the language by children 

(11) endangered - youths have experienced a decline in the use of the language and 
children experience language loss 

(111) seriously endangered - competent speakers are about 50 years old and, above 

(1v) moribund - competent speakers are very old, and, many are dead 

(v) extinct - when the last speaker dies; 


The status of Yorúbá is influenced by the language policy of Nigeria, which favours 
the use of English above all indigenous languages. It also pays lip service, for in- 
stance, to the national language policy of education, which states that the mother 
tongue or, the language of the immediate community must be adopted as the lan- 
guage of education in primary schools, and, English should only be introduced at 
a later stage. Other language policies in other domains that encourage the use of 
mother tongues are also not adopted. So that the regional or, national status of Yorúbá 
and, other regional languages is theoretically, but not fully implemented in practice 
(Fabunmi € Salawu 2005). 


Colonialism imported the English language to Nigeria and, English has since been 
adopted as the official language in government, education, and, all official busi- 
nesses. English is the language of the elite, and, fluency in English is synonymous 
with a good education. As a result, many parents, even those who are barely educated 
or, not educated at all, ensure that their children are taught in English right from the 
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elementary classes. In most schools, indigenous languages are referred to as ver- 
nacular and, are prohibited. Violation usually attract fines and, many times corporal 
punishment. 


Bilingualism is also believed to affect children's ability to attain competence in En- 
glish, and, thus, parents avoid speaking mother tongues at home for fear of raising 
children with poor communication in English. Many children therefore can neither 
speak, read nor write in Yorúbá, and, many do not even understand the language at 
all. 


In addition, the great linguistic diversity in Nigeria discourages people from speaking 
Yorúbá as often as they may have. Well over 450 languages are said to be spoken in 
Nigeria, therefore necessitating the use of English as the lingua franca (Less educated 
people use the Nigerian Pidgin (an English based creole of some sort) as a medium 
of communication, and, some educated people use the Nigerian pidgin in less formal 
environments) (Adegbija 2004). 


English is also the language spoken in offices, corporate organizations, and, the use 
of Yorúbá has greatly declined, resulting in lower competency among many users, 
code-mixing, code switching, and, several other language loss trends. In addition, al- 
though Yorubá is still widely used in media and, there exist radio and, television pro- 
grams in Yorubá, as well as newspapers, they receive their patronage from the older 
generation since there always exist the English versions, which receive a greater pa- 
tronage. 


All the afore mentioned language situation have influenced the lack of adequate lan- 
guage development, and, consequently resulted in, resource scarcity of Yorúbá. 


3.2 Yorubá Phonology 


The phonology of Yorúbá, which is how phonemes (Unit of distinctive sound that 
account for meaning distinction) are strung together to form words, comprises of 
seven oral vowels, five nasal vowels, three syllabic nasals and, seventeen consonants. 
Oral vowels are produced from the oral orifice, while nasal vowels are produced 
through the nasal orifice. Nasalized vowels, those vowels produced with the nasal 
and, oral orificies, are known to occur through an assimilation process when vowels 
preceed nasal consonants. All the seven oral vowels can be nasalized. 


Pitch, the perceptual correlate of vocal cords” frequency, is distinctive in Yorúbá. 
This distinctive/phonemic pitch is called tone. For example, the word rá(H) (disap- 
pear), rá(L) (buy) and, ra(M) (rub) are distinguished by the three tones in Yoruba: 
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High-tone, Mid-tone and Low-tone. High-tone is orthographically represented with 
acute accent, the Low-tone with grave accent and, the mid is unmarked. These tones 
can interact to form rising and, falling tones for instance ylí (this) and, náa (the). 
Vowels and, syllabic nasals are the tone bearing units in Yorubá. 


Consonant clusters are not permitted in Yorúbá but long vowels are possible. 


Central Back 


Labial Alveolar Palatal Velar Labiovelar | Glottal 


stops Voiceless t k kp 
Voiced b d g gb 

Affricates Voiced d 

Fricatives Voiceless F S 

Nasals m 


Approximants | lateral 
Central 


[—[5|0 
15 


Fig. 1. Yorúbá Vowel and Consonant Chart. 


3.3 Yorúbá Morphology 


Typologically, Yorúbá is an analytic language, that is, grammatical relations are ex- 
pressed with little or, no use of inflection. Tense is not marked morphologically, 
and, agreement relation is limited. It is a combination of isolating, that is, it has a 
low morpheme per word ratio, and, agglutinating through the use of prefixes, inter- 
fixes, reduplication (full and, partial reduplications) and, compounding. Prefixation 
and, reduplication are the most common word formation processes in Yorúubá. Word 
formation processes in Yorúbá are also derivational and, words changed through 
inflections are usually through tonal variations (Awoyale 1988). Due to the sylla- 
ble structure of Yorúbá, compounding usually involves vowel ellision, coalescense, 
epenthesis, and, compensatory lengthening to resolve vowel hiatus and, consonant 
clusters. 


, TRIANGLE e Volume 14 e 2016 e DOI: 10.17345/triangle14 e ISSN: 2013-939X 


8 I Adebara 


3.4 Yorúbá Orthography 


The Yorúbá language has been written since the early 19th century. However, there 
have been several changes in the orthography since then (Fagborun 1989; Olu- 
muyiwa 2013). 


Orthographically, the Yorúubá alphabet consists of 25 letters and, uses the familiar 
Latin characters. Nasalized vowels are represented with a 'n” after the vowel. Syl- 
labic nasals are written as 'n”, except when they occur before “b”, where they are 
represented as “m”. 


Although tones occur on syllables, they are orthographically marked on vowels and, 
syllabic nasals. Yorubá syllables are open; this means they end in vowels. The sylla- 
bles are formed by a single vowel, consonant plus vowel, or, a syllabic nasal. 


The present standards were established in 1974, however, there remains a great deal 
of contention over writing conventions, spelling, grammar, the use of tone marks and, 
some other linguistic formalities. For the purpose of this paper, we have adopted the 
generally accepted formalities of the standard language according to grammars by 
Bámgbósé (1966) and Awobuluyi (1978). These include full tone marking including 
tone marks on syllabic nasals. 


Aa Bb Dd Ee Ee Ff Gg Gbgb 
la] |[b]  |[d] [el |fe] [fl [e] [gb] 
Hh li Jj Kk  |Ll Mm |Nn Oo 
[a] Jl] [ds] [[k] [1 im] [ln] [o] ¡lol 

0o Pp Rr Ss Ss Tt Uu Ww 
[o] |[kp] [fr]  |[s] | [t] fu] [w] 


Fig. 2. The Yorúbá Alphabet and the Sounds they Represent. 


3.5 Constituent Structure of Yorúbá Noun Phrases 
As in English, the canonical word order is SVO, e.g, as in omo ra oúnje (child 


buy food). However, there are several interesting differences between the constituent 
structure of Yorúbá and, English. Five of these are within the scope of noun phrases 
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and, have been handled in this work. Details of how we address these differences are 
in section 7. 


(1) In the arrangement of constituents, Yorúbá has a determiner final position in 


structure and, determiners are not obligatory in noun phrases (Ajiboye 2006). 
So that ajá kékeré (dog small) and, ajá kékeré kan (dog small a) are felicitous in 
Yorúbá. 


(2) Yorubá has a superstructure, from which “adjectives” are derived (Awobuluyi 


1978; Bámgbósé 1966; Bowen 1858; Awoyale 2008; Ogunbowale 1970). For 
instance the word pupa (red) has two entries in the dictionary (Awoyale 2008). 
The first entry is as a noun in Pupa dára ju dúdú lo (red good more black than) 
which means red is better than black, and, as a verb in omó pupa (child red) 
which means, child is red. It is important to understand that in the example given 
for the first entry, pupa and, dúdú are nouns because both words can be replaced 
with the pronoun 'ó “he/she/it”, so that we can say ó dára ju ú lo. The ó is derived 
as ú after ju through an assimilation process because Yorúbá abhors vowel hia- 
tus. In cases of plural and, honorific nouns (just like tu and, vous in French), we 
will have Pupa dára ju áwon dúdú lo (red, good more plural, black than), Pupa 
dára ju wón lo (red good more them (or singular honorific) than)”. In the second 
example however, omó pupa has also gone through a vowel deletion and, elon- 
gation through an assimilation process, which turned omo ó pupa to omó pupa. 
The mid tone o was deleted and, the high tone o was elongated. Although the ó 
(which is a pronoun but functions as a determiner) in that sentense is implied but 
will not be articulated by native speakers of Yorúbá. omo pupa “red child” how- 
ever is an example where pupa performs a modifier or, adjective function to the 
noun omo. Several other words like “kékeré” “small”, úlá “big”, púpo “plenty” 
are examples of some nouns or, verbs that can function as adjectives. For the 
purpose of this paper, nouns or, verbs that modify other nouns are referred to as 
adjectives. 


(3) In Yorúbá, agreement is morphologically absent and, as a result, plurality is 


shown syntactically through the occurrence of a pronoun awon “they” before 
a noun as in awon omo (they child) which means “children”; addition of cardi- 
nals or, adjectives after a noun as in omo méji (child two) implies “two children”, 
addition of an elided form of the pronoun awon, before a demonstrative as in 
omo wón yen (child they), that means “those children” or, reduplication of cer- 
tain “adjectives” after the noun as in ajá dúdú dúdú (dog black black) (Ajiboye 
2006). It is important to note that the words used for plurality in Yorúbá have 
their own distinct meanings and, are used in certain contexts to depict plurality. 
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kongba (leg big big) will not be a plural expression despite both phrases having 
identical syntactic categories (Ogunbowale 1970). 

(4) Yoruúbá doesn't have a formal feature for indicating gender and, when gender 
distinction is mentioned in Yorúbá grammar, it is a translation equivalence, or, it 
1s with reference to the structure of English and, not Yorúubá (Bámgbósé 1966). 
The use of words like ako (male), abo (female), obinrin (female human being), 
okúnrin (male human being) can be used to express gender in words like: Abo 
kinihún (lioness), omo obinri (child female) or, “daughter”, ako eléde (pig) while 
the pronoun “o” is used to refer to he/she/it” (Bámgbósé 1966). We explain how 
we use gender features in section 8.7. 

(5) Another interesting distinction between Yorúbá and, English structure is the po- 
sition of adjectives in phrases. Many adjectives occur after nouns, but it is also 
common to have adjectives before the noun. For instance, ókú (dead) always oc- 
curs before a noun as in ókú eran (dead meat). Adjectives that describe a part of 
something always occur before a noun as in idaji oúnje half food”. Adjectives 
that describe the attribute of a person or, thing usually occurs before a noun as 
in kékeré ekún (small leopard), but there are some exceptions where having the 
adjective after the noun are accepted as correct (Ogunbowale 1970). We describe 
our results, which are consistent with this linguistic claim in section 9. 


Although, we cannot discount language universalities, these exceptions which can 
cause difficulty in simple comparisons have been managed in very interesting ways. 


4 Linguistic Background 


4.1 Data Collection 


Data collection for this research has been a combination of introspective and, em- 
pirical collection methods. The collection process commenced with the development 
of a context free grammar of noun phrases in Yorúubá. This grammar was devel- 
oped by linguists who also have native competence in Yorúbá. The first context free 
grammar was developed by the author who is also a linguist and, the grammar was 
extended by the other linguists Dr. Tunde Adegbola (African Languages Technology 
Initiative), Dr. Demola Lewis (University of Ibadan), Samuel Akinbo (University of 
British Columbia). The grammar was then used to generate phrases which were used 
as input phrases in our Womb Grammars model. In all, fourty five phrases were gen- 
erated. Native speakers of Yorúubá who do not have formal linguistic training were 
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invited to check the phrases generated by the context free grammar in order to ascer- 
tain that those phrases are intuitively correct to the regular user of the language. 


We developed a context free grammar because there is no known treebank of Yorubá 
and, Penn Treebank only has a dictionary of words. 


This approach of data collection was employed in order to ensure that our model is 
realistic, correct, and, robust. Introspection has proven to be the most reliable process 
of data collection and, also very useful for building models which require high level 
linguistic competence such as this WG model (Chomsky 1957). Introspection as 
previously mentioned, has been contributed by the author who is a native speaker 
of Yorúbá and, also has formal training in linguistics. We have double-checked our 
introspective conclusions by consulting seven other native speakers of Yorúbá, three 
of which also have formal graduate level training in linguistics. 


Data collected have also been compared with two existing grammars of Yorúbá. The 
first by Ayo Bámegbósé (1966) and, the other one by Awóbulúyí (1978). It was im- 
portant to observe these existing grammatical descriptions of Yorúbá, considering 
that they are among the earliest contributions of native speakers who have formal 
linguistic training to the description of the Yorúbá grammar (Chelliah 8 de Reuse 
2010). Ajiboye's (2006) description of Yorúubá noun phrases has also been very use- 
ful for verifying the grammar induced by our model, especially in relation to plural 
marking. 


4.2 Strategies for Part of Speech Parsing 


Accuracy of part-of-speech tagging is a critical and, fundamental building block for 
many computational linguistic tasks including grammar induction. Assigning cor- 
rect part-of-speech tags to each input word explicitly indicates some inherent gram- 
matical structure of any language and, a wrong part-of-speech tag will distort the 
grammatical structure of a language. Rule-based, data driven and, hybrid methods 
for part-of-speech tagging have been extensively described in literature (Wang éz Li 
2011). Rule-based methods are those derived from linguistic rules (Brill er al. 1990), 
data-driven methods are derived from statistical analysis of language data (Meri- 
aldo 1994), and, hybrid methods are a combination of rule driven and, data driven 
approaches (Sun 4 Bellegarda 2011). 


Data-driven approaches have yielded very good results, albeit for Indo-European 
languages and, other data rich languages like English, Dutch, German, etc. However, 
data driven approaches have error rates which are usually reducible by only a few 
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percentage, and, also work poorly with languages having a less fixed word order 
(Voutilainen 2012). 


Rule-based part-of-speech tagging on the other hand is the oldest approach that uses 
hand-written rules for tagging. Rule based taggers depend on dictionaries or, lexi- 
cons, that contain word forms together with their associated part-of-speech labels, as 
well as context-sensitive rules to choose the appropriate tags during application. The 
dictionary or, lexicon is consulted to get possible tags for each word. Hand-written 
context-sensitive rules are used to identify the correct tag 1f a word has more than 
one possible tag. The linguistic features of the word and, other words surrounding 
1t are analyzed for disambiguation purposes. For example, a tagger for English will 
have a rule such as: if the preceding word in a phrase is a determiner then the last 
word in the phrase must be a noun. 


We adopt a rule-based approach. Rule-based approach, though rigorous and, requir- 
ing a great amount of high level linguistic skills, yield good results for any language, 
including those like Yorúbá, which we have identified as resource scarce in section 
3 and, 3.1, as well as having a less fixed word order structure in section 3.4. 


The tagsets were developed, with the use of Awoyale (2008), of Yorúbá as well 
as native speakers of Yorúbá who have formal linguistic training. The tagsets were 
compared to the grammars of Ayo Bámgbósé (1966) and, Awóbulúyí (1978), one 
of the earliest grammar descriptions of Yorúbá by native speakers who have formal 
linguistic training. 


We use the following tagsets: 


1 noun - ajá (dog), eran (goat), etc 

1i pronoun - áwon (they), ¡wo (you), etc 

111 proper-noun - Ayo, Bámgbósé, etc 

iv determiner - kan (a), náa (the), etc 

v quantifier - gbogbo (every), idaji (half), etc 
vi adjective - dúdú (black), pupa (red), etc 


We further define features for each word in order to provide a fine-grained definition 
to each word tag. We use the following features: 


1 Number 


1i Gender 
111 Tone 
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1v Person 
v Definitiveness 
vi Case 


These features have been carefully chosen to ensure that our model accounts for the 
unique traits of Yorúbá. 


5 Property Grammars 


The idea of constraint is present in modern linguistic theories such as Lexical Func- 
tional grammars (LFG) and, Head-driven Phrase Structure grammars (HPSG) (Pol- 
lard % Sag 1994). However, constraint-satisfaction, a way of implementing con- 
straints, is not really incorporated in the implementation of these theories. We use 
a formalism called Property Grammar (PG) (Blache 2004), which is based com- 
pletely on constraints: all linguistic information is represented as properties of pairs 
of constituents, which allows parsing to be implemented as a constraint-satisfaction 
problem. The set of properties forms a system of constraints expressed over cate- 
gories. They represent different kinds of information (e.g. agreement, morphology 
or, semantics) that can be used typically for contextual restrictions. PG differs from 
HPSG and, LFG in that it does not belong to the generative syntax family, but to the 
model-theoretic syntax one (Blache 2000). 


Constraints represent information and, the first benefit of representing a problem 
using constraints is that of partially solving 1t, so this allows for partial solutions 
to be found even when a full solution is not available. These constraint-based or, 
property-based theories, such as Property Grammars (PG) (Blache 2004) evolved 
from Immediate Dominance/Linear Precedence (IDLP), which unfolds a rewrite rule 
into the two constraints: (1) of immediate dominance (expressing which categories 
are allowable daughters of a phrasal category), and, (2) linear precedence (expressing 
which of the daughters must precede which others). 


For example in the PG framework, English noun phrases can be described using con- 
straints such as: precedence (a determiner must precede a noun, an adjective must 
precede a noun), requirement (a singular non-generic noun must be used with a de- 
terminer), obligation (a noun phrase must contain the head noun), and, so on. The 
linguistic structure (e.g phrase, sentense, clause etc) is characterized by a finite list 
of the constraints it satisfies and, a list of constraints it violates, so that even in- 
correct or, incomplete phrases will be parsed. For instance, the phrase the professor 
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emeritus, which be characterized as satifying obligation, requirement, determiner 
precedence but will not satify the adjective precedence. This differs from traditional 
parsers which characterize a linguistic structure with either a parse tree or, a failure. 
Using PGs also enables us relax certain constraints by declaring conditions under 
which those constraints should be relaxed. For instance, the obligation rule of En- 
glish can be relaxed to allow pronouns and, proper nouns instead of only a noun 
because pronouns and, proper nouns can also function as the head of a phrase. Dahl 
and Blache (2004) encode the input PG into a set of CHRG rules that directly in- 
terpret the grammar in terms of satisfied or, relaxed constraints and, a syntactic tree 
is the implicit result. Womb Grammars which is an adaptation of this framework 
into grammar transformation (Dahl $ Miralles 2012b; Christiansen 2005) induces a 
language's syntactic structure from that of another. 


Presently, the PG formalism comprises the following seven categories (we adopt the 
handy notation of Duchier ef al. (2013), and, the same example here): 


Constituency A : S, children must have their categories in the set S 
Obligation A : AB, at least one B child 

Uniqueness A : B!, at most one B child 

Precedence A : B < C, B children precede C' children 
Requirement A : B => C, if Bis a child, then also C is a child 
Exclusion A : B 55 C, B and, C children are mutually exclusive 
Dependency A : B - C, the features of B and, C are the same 


Example 1. For example, if we denote determiners by D, nouns by N, proper nouns 
by PN, verbs by V, noun phrases by NP, and, verb phrases by VP, the context free 
rules VP = D N and, NP —> N, which determine what a noun phrase is, can 
be translated into the following equivalent constraints: NP : [D, NJ], NP : DL, 
NP: AN, NP :N!UNP:D=<N,D:(N:f]. 


In the PG formalism, A refers to the phrase or, sentence being tested. In our case, A 
refers to Noun phrases, B and, C are categories such as nouns, adjectives, etc. These 
properties contain the basic syntactic information. Other properties can be added 
1f necessary, in particular for integrating knowledge coming from other linguistic 
domains or, for particular phenomena, like long distance dependencies. 


The use of a dependency property makes it possible to express a dependency gram- 
mar using the formalism of property grammars. This is possible because, just like 
dependency grammars, dependency property is concerned with syntactico-semantic 
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relations. For instance np(dependence(adjective,noun)) is concerned with using fea- 
tures (described in section 4.2) to determine the gender and, number relationship 
between adjectives and, nouns, and, other dependency information can be modelled 
in similar fashion. The features are introduced for each word in the lexicon using the 
CHRG symbol word/3 (details in section 8.2). However, all the subsets of categories 
involved in the description of a given input can be characterized by the constraint 
system (1.e. the grammar). The constituency property contains dependency informa- 
tion that tell us each category can be associated to another. 


Thus, there is a general notion of characterization formed by the set of properties 
that succeed and, those that fail which together characterize an input. The charac- 
teristics of an input corresponds to the result derived from the constraint system at 
the end of the parse. The result of a parsed property is either satisfied or, unsatisfied. 
The interest of such a conception is that every property in the grammar states some 
constraint on well formedness. It can be the case that all constraints are satisfied, 
but this is not an imperative condition. All kinds of input can consequently receive a 
characterization. 


6 Background on Womb Grammars 


6.1 Womb Grammars 


Womb Grammar Parsing was motivated by the need to aid the world's linguist in 
describing the syntax of the many languages that are not being studied for lack of 
adequate resources. It induces the grammar of a target language from the grammar 
of a source language. The WG paradigm describes a language”s phrases in terms 
of constraints over properties of pairs of direct daughters called properties. WG ex- 
tends the parsing capabilities implicit in these properties into a model of grammatical 
induction, in addition to parsing. 


WG was presented in two versions: (1) Hybrid Womb Grammars, in which the source 
language is an existing language for which the syntax is known, and, (2) Universal 
Womb Grammars, in which the source syntax is a hypothetical universal grammar 
of the authors' own devise, which contains all possible properties of pairs of con- 
stituents. Womb Parsing has the novel approach of addressing a problem which more 
usually is solved as a machine learning problem through constraint solving. 


The grammar of our source language, English is described as properties of con- 
stituents as described by Blache (2004). We use the hybrid version of Womb Gram- 
mars, to which we feed the following English grammar: 
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Constituency NP : determiner, noun, adjective, pronoun, proper-noun, quantifier,; 

Obligation NP : Anoun; pronoun; proper — nouns 

Precedence NP : determiner =X noun; NP : determiner =< adjective; NP 
pronoun =< noun; NP : pronoun = adjective; NP : adjective =< noun; 
NP : quantifier < determiner; NP : quantifier < pronoun; NP : quantifier < 
adjective; NP : quantifier <= noun 

Requirement NP : noun => determiner 

Dependency NP : quantifier = noun; NP : adjective = noun; NP : determiner 
noun 


The nouns used in the noun phrases are proper nouns, common nouns, abstract 
nouns, pronouns etc and the features such as number, gender, etc are encoded in 
the features of the word/3 (more details in section 4.2 and 8.2). WG extends the 
parsing capabilities implicit in these properties into a model of grammatical induc- 
tion, in addition to parsing. The first implementation of WG (Dahl 8: Miralles 2012b) 
allowed greater efficiency by adopting a failure-driven approach where only failed 
constraints where analyzed, rather than explicitly calculating all successful and, un- 
successful constraints. However in adapting the model into Yorúbá, we have found 
1t more efficient to explicitly calculate satisfied constraints as well. This is partly be- 
cause in order to arrive at as nuanced a description as needed for Yorúbá, we had 
to extend the Property Grammar model to accommodate what we call conditional 
constraints: those constraints which have failed in some phrases and, succeeded in 
others, but also have a unique pattern responsible for this behaviour (more on this 
later). 


The general WG model can be described as follows: 


Let L” be the target language and, its lexicon (LE... Let ET be a given expression 


(a meaningful and, grammatical expression) of a target language L”. Likewise, let 
L* be the source language. Its syntactic component will be denoted a Let 
Seg” be a sequence of words of L%, which is a glossing correspondence i.e a literal 
transliteration (does not need to be meaningful and, or, grammatical) of ET and, E? 
be an expression of the language L* which is a meaningful translation of E”. The 
translation expression E* in L% of E” in L” should be meaningful and grammat- 
ical. If we can get hold of a sufficiently representative set of phrases, E”, in L7 
that are known to be correct (a set in which our desired subset of the target language 
will be represented), we can feed these to a hybrid parser consisting of dea He. 


and, La This will result in some of the sentences being marked as incorrect by 
the parser. An analysis of the constraints these “incorrect” sentences violate can sub- 


sequently reveal how to transform Dotes so that the parser accepts as correct the 
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sentences in the corpus of L7—.e., how to transform Dias into E by mod- 
ifying the constraints that were violated into constraints that accept the input. Seg? 
and E? are thus the gloss and translation expression of E”, incoporated to enable 
intelligibility for non-speakers of the target language. Figures 3 and 4 respectively 


show the problem and, our solution in schematic form. 


T T 5 
Lex L syntax? Esyntax 


Fig. 3. The Problem. 


LY 


corpus T Ss 
£; lex. L syntax 


properties 


Y 


Model Transformation 


Module 


E 
Lóyntax 


Fig. 4. The Solution. 


An Example 


Let L9 = English and, LY = Yorúbá, and, let us assume that English adjectives 
always precede the noun they modify, while in Yorúbá they are always postpositioned 


, TRIANGLE e Volume 14 e 2016 e DOI: 10.17345/triangle14 e ISSN: 2013-939X 


18 I Adebara 


(an oversimplification, just for illustration purposes). Thus “a red book” is correct 
English, whereas in Yorúubá we would more readily say “¡we pupa kan” (book, red, 


a). 


If we plug the Yorúbá lexicon and, the English syntax constraints into our WG parser, 
and, run a representative corpus of (correct) Yorúbá noun phrases by the resulting 
hybrid parser, the precedence property of IN will be declared unsatisfied when 
hitting phrases such as “Iwé pupa kan”. The transformation module can then look at 
the entire list of unsatisfied constraints, and, produce the missing syntactic compo- 
nent of L””s parser by modifying the constraints in L% so that none are violated 


syntax 
by the corpus sentences. 


Some of the necessary modifications are easy to identify and, to perform, e.g. for ac- 
cepting “¡wé pupa kan” we only need to delete the (English) precedence requirement 
of adjective before noun (denoted by adj < n). However, subtler modifications may 
be in order, after some statistical analysis in a second round of parsing: if in our L” 
corpus, which we have assumed representative, all adjectives appear after the noun 
they modify, Yorúbá is sure to include the reverse precedence property of English: 
n < adj. So in this case, not only do we need to delete adj < n, but we also need to 
add n < ad). 


6.2 Constraint Handling Rule Grammar (CHRG) 


Constraint Handling Rule Grammars (CHRG) are a constraint-based grammar for- 
malism added on top of Constraint Handling Rules (CHR) (Frúhwirth 1998) similar 
to the way Definite Clause Grammars are implemented over Prolog. A CHRG works 
as a bottom-up parser, and, the formalism provides several advantages for natural lan- 
guage analysis. A notable advantage is that the notation supports context-sensitive 
rules that may consider arbitrary symbols to the left and, right of a sequence (Chris- 
tiansen 2005). 


CHRG (CHR Grammars) strives to incorporate as much as possible of CHR”s ex- 
pressibility. This includes propagation, simplification, and, simpagation rules and, 
the capacity for a grammar rule to make considerations for arbitrary grammar sym- 
bols that may occur to the left and, right of a sequence that is supposed to match a 
given nonterminal. Ambiguity is not a problem for CHRG, all different parses are 
evaluated in parallel in the same constraint store —without backtracking. This re- 
sults in tagger-like grammar rules that can be used for disambiguating simple and, 
ambiguous context-free grammar rules, and, provides also a way to handle coordi- 
nation in natural language. In case of errors, the parser is robust enough to deliver 
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as its result those subphrases that have been recognized. Since the advent of CHR 
(Frúhwirth 1998) and, of its grammatical counterpart CHRG (Christiansen 2005), 
constraint-based linguistic formalisms can materialize through fairly direct method- 
ologies. 


In a nutshell, CHRG rules rewrite constraints into other constraints, that are subject 
to possible checks described in a rule*s guard and, stated as Prolog calls. 


Their general format is: 


a X PB /- 7 ::>G]|ó. 


This rule is called a propagation rule and, it means, if a; occurs before PB, and, P 
before y, and, G condition is fulfilled, then store d in the constraint store. The part 
of the rule preceding the arrow : : > is called the head, G the guard, and, ó the body; 
Q, B,ry, Ó are sequences of grammar symbols and, constraints so that 8 contains at 
least one grammar symbol, and, d contains exactly one grammar symbol which is a 
nonterminal (and, perhaps constraints); a (y) is called left (right) context and, P the 
core of the head; G is a conjunction of built-in constraints as in CHR. If left or, right 
context is empty, the corresponding marker is left out and, if G'is empty (interpreted 
as true), the vertical bar is left out. The convention from DCG is adopted that 
constraints (i.e., extra-grammatical stuff) in head and, body of a rule are enclosed 
by curly brackets. Special grammatical operators are provided for gaps and, parallel 
matching (parallel matching is used when it is required that more than one pattern 
matches the string to be recognized). Gaps and, parallel match are not allowed in rule 
bodies. A gap in the rule heads is denoted “...” while parallel match is denoted by 
“$$”. Gaps are used to establish references between two long distant elements while 
a parallel match is useful when more than one pattern is needed to match the string 
to be recognized (Dahl Miralles 2012b). 


A simplification (grammar) rule is similar to a propagation rule except that the arrow 
1s replaced by <: > and, the grammar symbols in the head are deleted. 


a Xp /=y<:>G|ó. 
A simpagation (grammar) rule is similar to a simplification rule, except that one 
or, more grammar symbols in its head are prefixed by a ! symbol, which means that 


such a grammar symbol is not removed. It can also be fully integrated with Prolog 
and, a single file can conveniently incoporate prolog, CHR and, CHRG codes. 


la X 18 /- ly <:> G 1] 0. 
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Constraint solving as an implementation paradigm for WG allows us to convey lin- 
guistic constraints and, also test them in a modular fashion. The results are also 
concise. 


7 Some Implementation Details 


Our CHRG implementation adapts the original implementation (Christiansen 2005) 
where the appropriate WG constraints are entered in terms of a constraint g/1, whose 
argument stores each possible grammar property. For instance, our English gram- 
mar hybrid parser for noun phrases includes the constraints below and, some others 
described in section 6.1: 


egMp(obligatority([noun, proper-noun, pronoun]))) - at least one noun or, pronoun 
or proper-noun child 

egMp(constituency(determiner))) - children must have their categories in the set 

e(np(precedence(determiner, adjective))) - determiner children precede adjective 
children 

e(np(requirement(noun, determiner))) - if noun is a child, then also determiner is 
a child 

e(np(dependence(determiner, noun))) - the features of determiner and, noun are 
the same 


and, so on. 


These properties are weeded out upon detection of a violation by CHRG rules that 
look for them, e.g. an input noun phrase where an adjective precedes a noun may 
provoke deletion of the constraint g(precedence(noun, adjective)) when the following 
CHRG rule applies: 


Iword(C2,F1,_):(N1,_N2),..., 

Iword(C1,F2,_):(_, N4), 

tg (np (precedence (C1,C2)))), fall(A, B))<:> 

(fail (np (precedence (C1,C2)), F1, F2, Nl, N4, A, B)). 


Fig. 5. Simpagation Rule. 


The parser works by storing each Yorúbá word in the lexicon in a CHRG symbol 
word/3 along with its category and, features (1.e. word(pronoun,[[plural, n/a], per- 
sonal, both, third-person,[low,mid]], won)). Since the CHRG parse predicate stores 
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and, abstracts the position of each word in the sentence, this simpagation rule in Fig- 
ure 5 is triggered when a word of category C2 comes before category Cl, given the 
existence of the grammar constraint that C1 must precede C2 and, the phrase bound- 
aries in which the word is found?. Each of the properties dealt with has similar rules 
associated with it. 


When the parse predicate is invoked, the constraints of the source grammar are tested 
with the input phrases of the target language. Constraints that are violated at least 
once are output as unsatisfied with the number of times they are unsatisfied and, the 
features involved. Constraints that are satisfied on the other hand are output as sat- 
isfied with the number of times they are satisfied, the features of the words involved 
and, the phrase boundaries of those two words. 


8 Methodology 


S.1 Modified Parsing that Calculates both Failure and Success Explicitly 


Previous models of WG focused on failure driven parsing, under the assumption that 
failed properties are usually the complement of those satisfied, so satisfied properties 
can be derived from the failed ones if needed and, in general, a grammar is induced 
by repairing failures. However, our more in depth analysis in the context of Yorúbá 
has uncovered the need for more detail than simply failing or succeeding, as in the 
case of conditional properties. We therefore now use a success conscious and, failure 
conscious approach for inducing the grammar of our target language, Yorúbá. Each 
input phrase of the target language is tested with all relevant constraints for both 
failure and, success. This makes the model slightly less efficient than 1f we only 
were to calculate failed properties, but of course the gain is in accuracy. 


Efficiency is still guaranteed by the normal CHRG way of operating: rules will only 
trigger when relevant, e.g. if a phrase is comprised of only a noun and, an adjective, 
1t will not be tested with, for instance, precedence(pronoun, determiner) or, any other 
constraint whose categories are different from those of the input phrase. We keep a 
list of all properties that fail and, another for those that succeed, together with the 
features of the categories of the words in each input phrase and, the counts of the 


2 Recall that in CHRG syntax the symbols prefixed with exclamation marks are kept, while 
the ones without are replaced by the body of the rule. The :(A,B) are used to retrive the 
word boundaries, ... signifies a gap greater or equal to zero, and, all(A,B) retrieves the 
phrase boundaries. 
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property (The count of a property is the number of times it occurs, in either the 
failed list, or, the succeeded list, and, each time a property is added to any of these 
lists, the count is updated for that property). It is important to state that while other 
constraints are tested for success and, failure, constituency constraints are tested only 
for success. This is because we are interested in checking that our target grammar 
shares similar constituents with our source language and, testing for failure will be 
irrelevant for these constraints. We also are able to induce constituents present in the 
target grammar that are not in the source grammar. More of this in section 8.5. 


8.2 How we Handle Tones 


Yoruúbá is a tone language, therefore it was imperative to ensure that tones are prop- 
erly represented. We adopt a full tone marking approach (as described in section 3.2) 
so that each word is marked with its tones in order to avoid ambiguities. The tones 
are also stored as features, so that for instance the word tútú (cold) that has two syl- 
lables, one with a high and, the other with a low tone. Each syllable respectively is 
stored as “High-low” in the features of the word. For instance: 


[túta]::> word(adjective, [[neutral, n/a], descriptive, both, [High —low)]], tútú). 


In the example, the category of the word is adjective, the features of the word are 
enclosed in square brackets and, the word is tútú. These tones are used to infer con- 
ditional properties in the second phase of parsing. So that 1f, for instance, a property 
1s found to succeed only if it is around words with certain tones, such property will 
be said to be conditional. The conditions of such a property will be the tones which 
form a unique pattern in the success of the property. It is important to note that the 
tones are not used in isolation of other features and, a property will be said to be 
conditioned on tones alone, if, tones are the only patterns responsible for succeess 
or, failure. The addition of tones makes our approach extensible to many other lan- 
guages including tone languages. In the case of non tone languages, the tones will 
not be necessary and, can be marked with n/a or may be replaced with any other 
traits useful for the language. 


$.3 Glossing of Phrases 


The system provides a record of the English gloss of every word in the target phrases 
and, this record is consulted during parsing to produce the English equivalent for 
each word in the input Yorúubá phrase. The gloss is rendered below every Yorubá 
phrase, and, the free translation in English comes immediately after. As in: 
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< 0 > awon < 1 > omo < 2 > púpo < 3 > 


they child plenty 
plenty children 


Fig. 6. Phrase Transliterations. 


$.4 How Conditional Properties are Induced 


The original Property-based model, as we have seen, succeeded in detecting and, 
signalling mistakes in the sentence, without blocking the analysis. In this first model, 
which is parsing-oriented, incorrect sentences could be “accepted” through declaring 
some constraints as relaxable. For instance, while from the context-free grammar 
rules shown in section 5, we wouldn't be able to parse “the the book” (a common 
mistake from cutting and, pasting in word processors), but this is possible, if we relax 
the uniqueness of determiner constraint in the constraint-based formulation. 


Relaxation can be made conditional (e.g. a head noun's requirement for a determiner 
can be made relaxable in case the head noun is generic and, in plural form, as in 
“Lions sleep at night”). The failure of relaxable constraints is signalled in the out- 
put, but does not block the entire sentence”s analysis. Implementations not including 
constraint relaxation capabilities implicitly consider all properties as relaxable. And 
in fact, when exploiting constraint-based parsing for grammar transformation rather 
than for parsing, this is exactly what we need, since in an unknown language any 
constraint may need to be “relaxed” and, even if needed, corrected. 


For that reason, we have considered it more appropriate, in the context of grammar 
induction, to state “exceptions” as part of a property itself, rather than separately in a 
relaxation definition. Thus we have created conditional properties, e.g. “conditional 
precedence(pronoun, noun)” which expresses that a pronoun preceeding a noun is 
conditional. We give the condition which says: “if the pronoun is plural and it is a 
personal pronoun and, can be used in place of both animate and, inanimate nouns”. 
This means that a pronoun preceeds a noun only if the condition holds and, the 
opposite ordering, if otherwise. We define a property as conditional 1f it happens that 
there occurs a pattern for which the property fails for some phrases and, succeeds for 
others. All constraints that fail and, succeed are tested in this phase. We find these 
properties by searching for features which are unique to the failure and, or, success of 
these constraints.The features which are responsible for this difference in behaviour 
form the condition under which such property succeeds or, fails. 
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Let us note that requirement(noun, determiner) is in fact a conditional property of 
English and, the condition under which this requirement property will not hold is 1f 
the noun is generic and, plural. So that while count and, or, non generic form of a 
noun require a determiner (e.g “The boy” and, “The boys”), a plural generic noun 
does not require a determiner (e.g Chickens lay eggs). 


$.5 Failed and Satisfied Properties 


For each phrase parsed, the failed and, or, satisfied properties are explicitly output. 
This enables us to identify which specific properties are satisfied for each phrase and, 
those which are unsatisfied. We also explicitly retrieve the word boundaries of every 
word analysed during parsing as well as the phrase boundaries where the words are 
found. This is basically to eliminate ambiguity that can occur in a situation where 
a single property fails or, succeeds more than once in a phrase, or, if the model is 
extended to include other phrases, for example a verb phrase, because the model for 
now is limited to noun phrases. The boundaries before the semicolon represent the 
pair of word boundaries while the second boundary after the semicolon represents 
the phrasal bondaries. 


<0>áwon< 1 >omo< 2 > púp9 < 3 > 


they child plenty 
plenty children 


Succeeded Property: np(obligatority([noun, proper-noun, pronoun]))1-2; 0-3 
Succeeded Property: np(obligatority([noun, proper-noun, pronoun]))0-1; 0-3 
Succeeded Property: np(constituency (pronoun))0-1; 0-3 

Succeeded Property: np(constituency (adjective))2-3; 0-3 

Succeeded Property: np(constituency (noun))1-2; 0-3 

Succeeded Property: np (precedence (pronoun, noun))0-2; 0-3 

Succeeded Property: np (precedence (pronoun, adjective))0-3; 0-3 

Failed Property: np(precedence (adjective, noun)) 1-3; 0-3 


Failed Property: np (requirement (noun, determiner))1-2; 0-3 


Fig. 7. Parse Results of a Sample Phrase. 
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In Figure 7, the parse results show that obligatority succeeds twice because there's a 
noun and, a pronoun in the phrase, three constituency rules succeed because there are 
three different categories and, two precedence rules succeed. The failed requirement 
and, precedence properties are also printed. 


$.6 Inducing Properties not Present in the Source Language 


We also have an additional functionality that finds all precedence and, constituency 
constraints that are absent in our source but present in our target language. 


prec (precedence (X, Y)) :- 
english_properties (List), 


not (member (g (np (precedence (X, Y))), List)), 

not (member (g (np (precedence (Y,X))), List)), 

X X= Y. 

word (C1,F1,_):(N1,_),...,word(C2,F2,_):(_,N2), 
lothers), fall(A, B))::> prec (precedence (C1,C2) 


| (succeed (np (precedence (C1,C2)),F1, F2, Nl, N2, A, B)). 


Fig. 8. Inducing Precedence Properties Present in Target Phrase but Absent in Source Gram- 
mar. 


Figure 8 shows that during parsing, every pair of words with categories C1 and, C2, 
features F1 and, F2 and, word boundaries N1 and, N2 are tested for precedence if 
and only if, the precedence rule of those words” categories doesn't already exist in 
any precedence rule of the property grammar of English. We define a predicate prec 
which checks that the proposed precedence rule and, its converse is not a member 
of the property grammar of English while we use others, a CHRG constraint to 
trigger this precedence rule. We do this in order to ensure that we do not create 
redundancies in a bid to infer precedence rules that occur only in the target language. 


The model has the capacity to test the precedence constraints by checking if such 
a constraint succeeds for all relevant phrases and, if the converse succeeds for any 
input phrase. If we find that the converse does not succeed in any of the input phrases, 
this constraint is induced as a property of the target language, else we search for a 
unique feature to ascertain if it should be induced as a conditional feature. In the case 
of constituency, like we explained in section 8.1, we are only interested in finding 
the constituent and, not the number of times it occurs or, otherwise. If a constituent 
not present in the source grammar is found at least once, in the input phrase of the 
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target language, then the constituent is induced as part of the grammar of the target 
language. 


$.7 Parsing each Property in our English Subset 
Parsing with Dependence Constraints 


Due to the structure of Yorúubá grammar with regards to gender and, number, detailed 
in section 3.5, we initialize all words with neuter gender and, dual number, save a few 
words which have their number inherent in their meaning and, function (words such 
as Opolopo (numerous), awon (third person plural). We also implement a predicate 
that creates a variant for each number or, gender tag based on the environment in 
which the word is found. This successfully handles the syntactic process of defining 
number and, gender in Yorúbá. The dependency rule of English is then tested for 
satisfaction and, otherwise. 


This parsing strategy clearly accomodates the existence of plurality in Yorubá with- 
out a previous knowledge of the peculiarities of Yorúubá”s syntactic strategies for 
number, as well as gender which is in reference to English. 


However, though plurality and, gender are present in Yorúbá grammar and, are seen 
to succeed in parse results, the presence of failed dependence relations is further ana- 
lyzed to determine if the dependency constraints should be a conditional property in 
Yorúbá. Results show that there is no pattern under which failure or, success occurs. 
This lays credence to research findings by linguists who have studied the Yorubá 
grammar (Awóbulúyí 1978; Bámgbósé 1966; Ajiboye 2006). 


Parsing with the Obligatority Constraint 


Previous models of Womb Grammars failed if a noun was absent; the obligatority 
constraint in our version of WG only fails 1f a phrase doesn't have a noun or, pronoun 
or, proper noun constituent as described in section 8.4. Obligatority succeeds if the 
converse occurs. This idea eliminates the possibility of obligatority failing because 
1t contains a personal noun which is a valid obligatory category. 


word (C1,F1,_):(N1,N2),(g (np (obligatority(C)))), 
fal1(A,B))::> member (C1,C)| 
ísucceed (np (obligatority(C)),C1,F1,N1,N2,A,B)). 


Fig. 9. Rule for Succeeding Obligatority. 
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In Figure 9, we declare a list of categories C which contains a noun, proper-noun 
and, pronoun. The obligatority constraint is satisfied if C1 is a member of C. 


This approach enables us to check if pronouns and, proper nouns in Yorúbá perform 
the same head function as they do in English. Our results indicate that proper nouns 
and, pronouns can indeed function as the head of a phrase as in English. 


Parsing with Precedence Constraints 


In parsing a precedence constraint, we use the precedence rules of English. A 
precedence rule is satisfied if the target phrase has exactly the same ordering as 
English. For instance in Yorúbá, every occurrence of precedence (det,n), 
precedence (det, adj) fails while precedence (adj, n) fails in certain in- 
put phrases and, succeeds in other input phrases (details of this are given in Appendix 
1). This gives us adequate information to make a valid conclusion that in Yorúbá de- 
terminers always come after nouns and, after adjectives. However, with the presence 
of both failed and, successful instances of adjectives and, noun orderings, and, a pat- 
tern of features responsible, we can only make conclusions that Yorúbá nouns and, 
adjectives have different orderings. The system materializes this in our output as: 


-=conditional precedence (adjective, noun) :- 

adjective preceeds noun if adjective is plural, 
quantity-uncountable, can be used for both animate and inanimate 
nouns 


Fig. 10. A Conditional Precedence Property. 


Our results in Figure 10 reiterate linguistic findings by Yorúbá grammarians (Awóbulúyí 
1978; Bámgbósé 1966). 


word (C1,F1,_): (N1l, _),...,word(C2,F2,_):(_, N4), 
íg (np (precedence (C1,C2)))), fall(A, B))::> 
ísucceed (np (precedence (C1,C2)), Fl, F2, Nl, N4, A, B)). 


Fig. 11. Precedence Rule for Checking Success. 
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In Figure 11 we show from our code that precedence constraints are satisified 1f 
and, only if a there exists precedence (C1,C2) rule in English, and, an input 
phrase where C1 preceeds C2. The categories C1, C2 and, the features F1, F2 of the 
words are stored in a list if the precedence rule is satisfied. We also retrieve the word 
boundaries and, phrase boundaries as described in section 8.5. 


Parsing with Constituency Constraints 


A success driven approach is adapted for parsing constituency. This is because we 
are only interested in the presence of the constituent and, not the number of times 
1t occurs in parsed phrases. Previous Womb Grammar formalisms didn't test for 
constituents and, this resulted in adding constituents that are absent in the target 
grammar to the target grammar simply because they exist in the source grammar. We 
also have a function that can induce constituents that are in the target language but 
absent in the source, more of this in section 8.6. 


word (C1,F1,_):(N1, N2),(g(np(constituency(C1)))), 
fall(A, B))::> 
(succeed (np (constituency(C1)), Fl, Nl, N2, A, B)). 


Fig. 12. The Constituency Rule. 


In Figure 12, every time a word is found, the category of the word is tested with the 
constituency rule of English. If the category of the word is found in the English prop- 
erties, then it is satisfied and, added to a succeeded properties list and, subsequently 
induced. We also store the word boundaries and, phrase boundaries as in section 8.5 


Parsing with Requirement Constraints 


We test requirement by checking the constituent that co-occur with another con- 
stituent in a phrase. 
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check_waits X wait (Prop, F1, F2, N1, N2, A, B), g(Prop) <=> 
fail(Prop, Fl, F2, Nl, N2, A, B). 
check_waits <=> true. 


word (Required, F1,_): (N1,N2), 

íg (np (requirement (Required, Requiring)))),(all(A, B)) ::> 

(wait (np (requirement (Required, Requiring)), Fl, [], N1l, N2, A, B)). 
(wait (np (requirement (_,Requiring)),_,_,_,_,r_,))» 
Iword(Requiring,_,_)<:>true. 


Fig. 13. Rules to Test Requirement Failure. 


In Figure 13, we test whether requirement fails by checking that as daughter of the 
same mother a Requiring category doesn't occur with a Required category. 
We achieve this by saving the constraint wait /7 everytime we find a word with 
a Requiring category and, there exists a property that says Requiring cate- 
gory requires a Required category. We continue to wait till the entire phrase is 
parsed, if peradventure Required will be a category in the phrase which should 
not necessitate a failure. If no Required is found within that phrase, the category 
Requiring and, its features F'2, its word boundaries N1 and, N2 and, the phrase 
boundaries A, B where Requiring was found are added to the failed properties 
list; 1f Required is found, we delete wait /7. 


assign(A,B,C,D,A,B,C,D). 


Iword(X,FX,_): (N1,_N2),...,!'word(Y,FY,_):(_,N4), 

íg (np (requirement (C1,C2)))),(1a11(A,B)) <:> 

X= C1l, Y = C2 -> assign(X, FX, Y, FY, Requiring, FRg, Required, FRd); 
X= C2, Y = C1 -> assign(Y, FY,X,FX,Requiring,FRg, Required, FRd) | 
[succeed (np (requirement (Requiring, Required)), FRg, FRd, N1l, N4,A,B)). 


Fig. 14. The Rule to Test Requirement Success. 


In testing for success as in Figure 14, if a daughter Requiring of a phrase requires 
a sibling Required, we must check that in that phrase (e.g. np) when Requiring 
appears as a daughter, Requi red is also a daughter of that phrase. In the implemen- 
tation, we check if a Requiring and, Required occur in the same phrase. The 
order of the categories is not important here, as we are simply checking if it occurs 
anywhere within a phrase. We store the features F1, F'2 of the word to induce condi- 
tional properties in the second phase of parsing. We also store the word and, phrase 
boundaries which were retrieved as in section 8.5. 
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9 Results and Supporting Evidence of Correctness 


Our results so far have been consistent with linguistic research of Yorúbá grammar 
which we prove for a fragment of NPs. We also use phrases generated by our Context 
Free Grammar (CFG), which we wrote for a fragment of NPs considered as the 
evaluation data in our WG model and, the induced grammar have shown similarities 
with the CFG. Details of the induced grammar are given in Appendix 1. 


It is important to state that despite equivalences that our induced grammar share with 
the CFG subset, our induced grammar explicitly encodes more information than the 
CFG. This is because, context free formalisms are unable to directly accommodate 
extra information such as features, and, their related linguistic constraints, as their 
grammar symbols can only be simple identifiers, with no possibility of carrying ex- 
tra arguments, as logic grammar symbols can, to transmit and, consult such extra 
information. 


We summarize our results into constituency, precedence, requirement, dependency 
and, obligatority. 


1 Constituency: Our constituency results show that in Yorúbá, nouns, pronouns, 
proper-nouns, adjectives, quantifiers and, determiners are allowable categories 
in noun phrases. These constituents are featured in noun phrases described by 
Ogunbowale (1970), Awóbulúyí (1978) and Bámgbósé (1966) as well as in our 
CFG of Yorubá. 

2 Precedence: We induce two conditional precedence properties (although con- 
ditional precedence(adjective, noun) has two different conditions), and, nine 
precedence properties. Our conditional precedences imply that there are two 
orderings, which support different orderings in pronouns and, nouns, and, in 
adjectives and nouns, in for instance, in rules 10 and 11, and, 14 and 15 of our 
CFG, and, also in literature (Ogunbowale 1970). However, we do not induce a 
property for quantifier and, noun. This is because, there exist no known pattern 
responsible for the difference in order, which is consistent with research claims 
of Awóbulúyí (1978). 

3 Requirement: We do not induce any requirement between nouns and, determiner. 
This is because of a lack of pattern in features where the requirement property 
succeeds and, where it fails. This is consistent with our CFG which has rules 
where nouns occur with determiners, as well as rules where nouns occur with- 
out determiners. This conclusion is also presented in research (Bámegbósé 1966; 
Awóbulúyí 1978; Ajiboye 2006). 
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4 Dependency: Our model also does not induce dependency rules. This is because 
there was no unique feature present with instances where dependency failed and, 
when it succeeded. This again is supported by Bámgbósé (1966), but not explicit 
in our CFG of Yorúbá. 

5 Obligatority: Obligatority succeeded in all input phrases, showing that at least one 
of noun, pronoun and, proper-nouns is a compulsory constituent of Yorúbá NPs. 
Our CFG also shows these three constituents occur at least once in all rules for 
NPs. 


10 Possible Extensions 


We covered a useful subset of Yorúubá noun phrases, but there are some phenom- 
ena not covered here. For instance, there are some words that are noun phrases with 
a determiner interfixed between two occurrences of the same words. For example, 
omokómo (child any child), ilékilé (house any house), asokáso (dress any dress), 
1wákuwa (behaviour any behaviour), igbakigbá (time any time) etc. In certain con- 
texts, these words have different meaning, as in, omokómo (child bad child), ilékile 
(house bad house), 1wákuwa (behaviour bad behaviour) etc and, these contexts, de- 
termine the categories that can occur around them. It would be interesting to develop 
a parser that accomodates these features. Extending our program to identify and, 
parse features such as vowel elision, assimilation of tones, compensatory lengthen- 
ing and, other phonological processes that have grammatical functions in Yorubá 
would also be helpful. 


Further interesting ramifications of our work would also include: testing our sys- 
tem for a larger coverage of syntax (we have addressed noun phrases so far), in- 
ducing other constraints (besides precedence and, constituency constraints which 
we induced) present in the source language but not in the target language, testing 
our model on other tonal-sensitive languages, studying how assimilation influences 
language structure especially in tone languages, studying whether any further con- 
straints or approach extensions would be needed to accommodate families of lan- 
guages not easily describable within our approach (e.g. languages which have dif- 
ferent categories from the source language, those who have different inflectional 
paradigms from the source language, those that exhibit constraints not among our 
allowable set of constraints). 
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11 Conclusions 


We have shown the simplicity with which Womb Grammar automatically induces 
the grammar of Yorúbá from that of English despite the peculiarities in the grammar 
of Yorúbá and, English that can make this very difficult. This makes our model very 
useful in language development and, language documentation. 


We have also presented a concrete system, for inducing Yoruba grammar that con- 
stitutes a proof of concept for the Womb Grammar model (Dahl 4 Miralles 2012b). 
WGallows users to input English grammar description in modular and, declarative 
fashion, e.g, in terms of the linguistic constraints that relate to the subset of noun 
phrases we consider (constituency, precedence, dependency, obligatority, require- 
ment). Since such descriptions also stand alone as a purely linguistic model of a 
language's syntax, our system can cater even for users who are not conversant with 
coding, such as pure linguists wanting to perform syntactic model transformation 
experiments aided by computers. Their purely (constraint-based) linguistic descrip- 
tions of syntax automatically turn into executable code when appended to our code. 
We also used a subset of noun phrases which can accept any number of adjectives 
making our model extensible to induce even finer details such as precedence order 
of adjectives if we so desire. 


As we have seen, our system automatically transforms a user's syntactic descrip- 
tion of a source language into that of a target language, 1.e Yorúbá, of which only 
the lexicon and, a set of representative sample phrases are known. While demon- 
strated specifically for English as source language and, Yorúbá as target language, 
our implementation can accept any other pair of languages for inducing the syntactic 
constraints of one from that of the other, as long as their descriptions can be done in 
terms of the supported constraints. 


We have thus adapted a flexible modelling framework solidly grounded in linguistic 
knowledge representation which, through the magic of constraint solving, turns into 
an efficiently executable problem solving tool. We maintain the modularity feature of 
the first implementation in our adaptation, therefore, our model can support revision 
and, adaptation quite straightforwardly: new constraints between immediate daugh- 
ters of any phrase can be modularly added and, implemented, without touching the 
rest of the system. 


Our model allows for accommodating solution revisions at execution time by inter- 
acting with a linguist whenever constraints can not be induced consistently. Visual 
representations of the output that would be helpful for linguists in this respect have 
been explored in Adebara £ Dahl (2015). 
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Appendix 1: Results 


Due to space constraints, the failed-properties and, succeeded-properties list as well 
as the phrases parsed have been removed from this results. We present only a subset 
of the induced grammar. 


Induced Property Grammar rules for Yoruba Noun phrases::- 
-conditional precedence (pronoun, noun) :- 

pronoun preceeds noun if ¡pronoun is plural, personal, 
and can be used for both animate and inanimate nouns, 
and third-person. 

-=conditional precedence (adjective, noun) :- 

adjective preceeds noun if adjective is plural, 
quantity-uncountable, an can be used for both animate and 
inanimate nouns. 
-obligatority ( (noun;proper-noun;pronoun)) :- 
noun;proper-noun;¿pronoun are obligatority. 

It succeeds in all 47 input phrases. 

noun succeeds in 39 relevant phrases; 

pronoun succeeds in 4 relevant phrases; 

proper-noun succeeds in 4 relevant phrases; 

-precedence (quantifier,pronoun) :- 

quantifier preceeds pronoun in all 4 relevant phrases 
-precedence (quantifier, adjective) :- 

quantifier preceeds adjective in all 3 relevant phrases 
—precedence (pronoun, adjective) :- 

pronoun preceeds adjective in all 3 relevant phrases 
—precedence (pronoun, determiner) :- 

pronoun preceeds determiner in all 7 relevant phrases 
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Violencia Lingiiística en las Redes Sociales 
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Abstract. Taking into account that, currently, violence is a very frequent phenomenon, this 
article analyzes a specific type of violence, namely linguistic violence. Specifically, out anal- 
ysis deals with two topics: the different degrees of violence in speech acts and the resources 
and techniques that are used to produce violent utterances. By considering politeness stud- 
ies focused on impoliteness, the work proposes a categorization of violent speech acts that 
reflects different levels of violence, understanding, therefore, violence as a gradual and non- 
categorical concept. In the study, a corpus of interactions extracted from Twitter and Facebook 
is analyzed. The rise of social networks, their ease of use and their features make of these plat- 
forms an excellent database for this type of analysis. The results show a significant presence 
of high levels of linguistic violence in social networks, being the implicitness a feature that 
in most cases characterizes these utterances. Those results led to reconsider the common idea 
that defends that explicitness is necessary in order to label an action as violent, and the out- 
standing presence of high violence categories. It would be necessary to pay more attention to 
the violent implicit content of utterances which, as shown by the analysis, is not less violent 
than the explicit one. 


Keywords: Violence, language, impoliteness, social networks. 


Resumen. Considerando que la violencia es un fenómeno muy presente en la actualidad, en 
el presente artículo se expone el estudio cuyo objetivo es analizar un tipo de violencia especí- 
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fico: la violencia lingúística. En concreto, se ocupa de los grados de violencia, así como de los 
recursos y las técnicas que se utilizan para emitir actos de habla violentos. Con un análisis de 
los estudios cartesiológicos, centrado en la descortesía, se ofrece una propuesta de categorías 
de violencia y diferentes grados. En el estudio realizado se analiza un corpus de ejemplos 
extraído de las redes sociales Twitter y Facebook; el auge de estas plataformas, su facilidad 
de uso y sus características convierten a este tipo de plataformas en un excelente banco de 
datos para realizar estudios como el que se plantea en el trabajo desarrollado. Los resulta- 
dos obtenidos tras el análisis del corpus muestran la importante presencia de grados altos de 
violencia lingúística en las redes sociales y la implicitud, en la mayoría de los casos, que ca- 
racteriza a estos enunciados. Cabe, quizá, replantearse la necesaria explicitud de las acciones 
para que sean consideradas violentas, así como la destacada presencia de las categorías de alta 
violencia. Es necesario prestar más atención a las acciones implícitas que, como demuestra el 
análisis, no restan carácter violento al enunciado. 


Palabras clave: Violencia, lenguaje, descortesía, redes sociales. 


1 Introducción 


En la actualidad, la violencia se halla en muchos aspectos cotidianos, tanto glo- 
bales o colectivos como personales o individuales. En los últimos años, el número 
de acciones agresivas ha ascendido, como muestran los medios de comunicación que 
diariamente se hacen eco de noticias sobre casos de violencia. 


Como acción del ser humano, la violencia puede llevarse a cabo mediante actos de 
habla que, generalmente, la sociedad percibe como menos violentos que las agre- 
siones físicas. Creemos que, aunque la presencia de daño es necesaria para hablar 
de violencia, éste no ha de ser ni inmediato ni altamente perceptible. De hecho, la 
violencia lingiística, más sutil que la física, pasa por ser en muchos casos implícita. 


La descortesía, tratada como violencia, ha sido investigada en el ámbito hispánico 
en las dos últimas décadas (Haverkate 2012; Brenes Peña 2007-2009; Blas Arroyo 
2008-2010; Fuentes 2008-2009-2010; Programa EDICE, etc.). Sin embargo, su pre- 
sencia en las redes sociales no ha recibido una atención especial. 


Internet, la Web 2.0 y las redes sociales se han convertido en un gran corpus para 
el estudio de la comunicación, sobre todo para análisis que adopten un enfoque so- 
ciopragmático o sociolingiístico, así como los usos sociales de las tecnologías (An- 
droutsoupoulos y Beisswenger 2008). 


Así, las redes sociales se han convertido, desde la década de los 90, en una fuente de 
corpus lingiístico para el estudio de la comunicación mediada por ordenador (Pano 
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Alamán y Moya Muñoz 2016; Pano Alamán y Mancera Rueda 2014b). Además, con- 
forman un contexto en el que “han surgido conductas hasta ahora inéditas” (Gómez 
Arraigada 2013). Éstas permiten el mayor grado de interactividad en la red (Ciber 
Sociedad 2009): los usuarios pueden comentar publicaciones ajenas con libertad y 
sin ninguna restricción: en Twitter el hashtag permite comentar la intervención de 
cualquier usuario, y en Facebook, el hecho de seguir un grupo o página permite a 
los internautas comentar otras publicaciones en esa página, aunque el usuario emisor 
“no se tenga en amigos?”.La inmediatez, ubicuidad y espontaneidad llevan al usuario 
a una revisión casi constante de estas aplicaciones, lo que propicia un incremento de 
uso. 


El estudio que presentamos pretende analizar la violencia lingiística, estableciendo 
distintos grados y tipos de violencia; analizando las diferentes maneras de mani- 
festarse la violencia en el lenguaje; y describiendo las estrategias utilizadas para 
enmascarar mensajes inherentemente violentos. 


Para ello, nuestro trabajo se ha dividido en dos partes complementarias: una parte 
teórica, en la que se ha analizado la bibliografía sobre violencia lingilística y las 
teorías pragmáticas que sustentan nuestro análisis; y una parte empírica, en la que 
hemos recogido y analizado un corpus de datos propio procedente de las redes so- 
ciales. 


Las redes sociales seleccionadas han sido Twitter y Facebook. La recopilación del 
corpus de ejemplos se ha realizado mediante las aplicaciones Storify y Twitter 
Archiver*, y se han recogido 1270 publicaciones* (710 de Twitter y 560 de Face- 
book). El valor del corpus es cualitativo, no cuantitativo: se han seleccionado los 
comentarios que se han considerado significativos. 


A su vez, se ha analizado la literatura sobre violencia lingiística y se ha propuesto 
una clasificación propia que, seguidamente, se ha aplicado en el análisis del corpus. 
No se trata de una clasificación genérica, otras clasificaciones serán igual de válidas. 


2 Twitter y Facebook son las redes sociales más populares: Facebook, 81%; Twitter, 43%, 
según el estudio del VII Observatorio Redes Sociales (16/12/2015). 

3 Storify permite seleccionar tuits y comentarios concretos, ordenarlos y descargar el do- 
cumento que se ha creado; Twitter Archiver posibilita la recogida de tuits y retuits de un 
hashtag de manera masiva. 

* Los anexos recogen el corpus de datos analizado. 
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2 Marco Teórico 


2.1 Actos de Habla: Austin y Searle 


Austin en Cómo hacer cosas con palabras (1955) marca la discrepancia en relación 
con la definición tradicional de enunciado, cuya verdad depende de su correspon- 
dencia con la realidad objetiva. La base de la teoría que promulga es la distinción 
entre enunciados constatativos y realizativos: la misma oración puede ser empleada 
de manera realizativa o constatativa, han de adecuarse a los hechos o tener cierta 
relación con ellos. De entre otras teorías, ha estudiado el discurso indirecto como 
fenómeno social (Trenc 2014). 


Seguidamente, sustituye esta dicotomía por tres fases o actos que conforman la 
emisión de un enunciado: el acto locucionario, el acto ilocucionario y el acto per- 
locucionario, que corresponden a la realización de acciones (el acto locucionario 
posee significado; el acto ilocucionario, fuerza, y el acto perlocucionario, efectos). 
Austin demuestra que hablar siempre es hacer algo y que un enunciado puede de- 
sempeñar diversas funciones, una de las cuales —no la única— es describir. 


Searle (1986), discípulo de Austin, presta atención al significado del acto ilocu- 
cionario, fruto de la combinación de convención e intención. Así, la emisión de un 
enunciado en un contexto determinado es realizar convencionalmente una acción 
concreta (Ruiz Antón 1998). Searle (1976) defiende que es necesario distinguir entre 
dos fuerzas ilocucionarias: el acto primario, que no es literal, y el acto secundario, 
que es literal. Para distinguirlos, el interlocutor ha de ser consciente de que se trata 
de un enunciado indirecto y urge una estrategia inferencial, en la que entran en juego 
la información compartida (conocimiento léxico y enciclopédico) y la racionalidad 
(dentro de la cual está la memoria). 


Aunque no existen reglas que determinen un acto de habla como indirecto, ciertas 
formas idiomáticas adquieren usos convencionales y son interpretadas como tal si el 
receptor posee las mismas claves culturales que el emisor (Searle 1976; Escandell 
Vidal 1993; Terkourafi 2008; Sperber y Wilson 1986). 


2.2 Cálculo del Mensaje Implícito: Teoría de la Relevancia 


Siguiendo el modelo inferencial, Sperber y Wilson (1986) defienden que el oyente ha 
de rellenar el enunciado con información extralingúística para, así, obtener una su- 
posición enriquecida contextualmente que corresponde a una proposición (Portolés 
2004). 
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Con fuerte base en la teoría de Grice (1975), Sperber y Wilson toman la máxima 
de la relevancia como fundamental en la comunicación: siempre se cumple, pues los 
humanos actuamos según este principio (Albelda y Barros García 2013). Por ello, 
cualquier acto ostensivo (entre ellos, la comunicación verbal) conlleva la presunción 
de relevancia; se vincula con el efecto contextual: cuanto mayor es el efecto contex- 
tual, mayor es la relevancia. 


El concepto de contexto es una representación del mundo compuesta por supuestos, 
conjuntos de conceptos estructurados de manera que su orden determina el modo en 
que han de procesarse. El contenido de un supuesto está determinado por las entradas 
lógicas de los conceptos que contiene, mientras que el contexto en el que se procesa 
está determinado por las entradas enciclopédicas de dichos conceptos. De este modo, 
la comunicación se basa en el deseo de alterar (maximizando o minimizando) el 
entorno cognitivo del interlocutor, de que sus procesos mentales se vean afectados, 
y el contexto se concibe como producto de la interpretación (Yus 1997). 


Para llevar a cabo un procesamiento eficaz es necesario percibir la intención del 
emisor mediante la construcción de hipótesis, es decir, el reconocimiento de los 
supuestos a los que el emisor alude para garantizar que su estímulo es relevante. 


Un mensaje verbal determina qué conceptos han de activarse y los reúne de forma 
lógica para que puedan ser usados como suposición (Yus 1997). Así, la comunicación 
comprende tres niveles: 


1. La descripción lingiística (o entrada lógica) 
2. Las representaciones semánticas (o entrada enciclopédica) 
3. El esquema de supuestos (o derivaciones implicadas). 


Para ello se requieren dos procesos pares: la codificación y descodificación, y la 
ostensión e inferencia. 


Según la teoría de la relevancia, con la comprensión se obtiene inferencialmente 
una suposición enriquecida contextualmente que se corresponde con una proposi- 
ción. Sperber y Wilson, pues, aportan una vía teórica que explica la comprensión en 
ausencia de muchos elementos contextuales físicos, puesto que el contexto surge de 
la combinación del mecanismo perceptivo con la memoria. 


2.3 Cortesía: Lo Socialmente Adecuado 


Las teorías cartesiológicas definen la cortesía como una decisión del hablante que 
depende del contexto: se trata de un mecanismo regulador de las relaciones sociales, 
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no de la comunicación en sí, y el contexto es crucial para interpretarla (Haverkate 
1994). 


Desde una perspectiva cognitivista (como la de Sperber y Wilson), la cortesía es 
convención y tiene un papel importante en los supuestos previos que se tienen del 
comportamiento social adecuado (Albelda Marco y Barros García 2013): se toma la 
cortesía como lo esperado en determinado contexto. La cognición humana se sirve de 
dos módulos cognitivos especializados: el sistema cognitivo inferencial y el sistema 
cognitivo social; se lleva a cabo una doble actividad cognitiva (Yus 2010). La ma- 
nifestación de cortesía, así, depende del contexto sociocultural (Bravo 2008; Brenes 
Peña 2009b) 


La reiteración de comunicaciones forja una imagen cada vez más nítida de normas, 
intereses, metas comunes y demás que subyacen a la sociedad: crea simetría psi- 
cológica (Haverkate 2012). 


Teoría de la Cortesía 


Brown y Levinson (1987) postularon la teoría que más se ha empleado en los estudios 
pragmáticos y sociolingúísticos sobre cortesía, y tiene el propósito de complementar 
al estudio de Grice (1975) ocupándose de los aspectos sociales de la comunicación 
(Carrasco Santana 1999: 2). 


Brown y Levinson definen la cortesía como la inferencia de los interlocutores acerca 
de las intenciones del hablante; por ello, la forma de los enunciados influye en cómo 
será interpretado por el receptor en términos de cortesía. 


Los interactantes que toman como modelo son competentes miembros de una so- 
ciedad que poseen una imagen [traducción de face, tomado de Goffman (1967)], la 
propia imagen pública que todos los miembros quieren mantener. Esta imagen se di- 
vide en imagen positiva [o afiliación (Bravo 1999)] e imagen negativa [o autonomía 
(Bravo 1999)]?. 


Para Brown y Levinson la conversación es inherentemente conflictiva, pues amenaza 
a las imágenes de los interlocutores: algunos actos, como dar órdenes o prometer, 


5 Este modelo de cortesía aplicado al español será estudiado por Carrasco Santana (1999), 
Garrido Rodríguez (2006) y Haverkate (1994). Bravo (1999) incorpora el elemento so- 
ciocultural a la idea de imagen, de modo que la cortesía depende del grupo cultural, del 
contexto sociocultural en el que se realiza dicha actividad, así como de la modalidad dis- 
cursiva y situacional del momento (Medina López 2011); la cortesía toma un valor relativo 
a la cultura. 
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atacan la imagen negativa; otros, como criticar o insultar, la imagen positiva, aunque 
cabe la posibilidad de que se ataque a ambas imágenes en un mismo acto comunica- 
tivo. 


Por ello, defienden el uso de determinadas estrategias lingilísticas que mitiguen estos 
actos amenazantes y proponen una fórmula para evaluar cuál es preferible, en la que 
se tienen en cuenta la distancia social, la relación de poder y el nivel de imposición 
permitido culturalmente (W x = D(S, H) + P(H, S) + R). 


Con todo, destacan que no todos los hablantes escogerán la misma estrategia en las 
mismas condiciones, sino que es necesario sopesar cuándo las consecuencias serán 
menores y qué estrategia dará mejor resultado. 


De este modo, dividen los actos amenazantes según si emplean estrategia y según si 
dicha estrategia es convencionalmente cortés o el enunciado es ambiguo: 


Actos directos [cumplimiento del Principio de Cooperacion de Grice (1975)]. 
Actos con estrategia indirecta y abierta? (adición de elementos para mostrar que 
no hay intención de dañar). 

e Actos con estrategia encubierta (ambigiledad, se ofrece libertad de interpretación). 
Evitar el acto (desistimiento en la emisión del acto). 


Brown y Levinson defienden que el uso del discurso indirecto es la estrategia que 
asegura la cortesía de cualquier acto, afirmación por la que han sido criticados (Terk- 
ourafi 2008; Carrasco Santana 1999; Haverkate 1994; Culpeper 1996). Se trata de 
la concepción tradicional de la cortesía como expresión de la distancia y estructura 
social, desde una perspectiva anglosajona. 


Teoría de la Descortesía 


Considerada, en oposición a la cortesía, como una agresión o amenaza intencional a 
la imagen del oyente (Albelda y Barros García 2013), la descortesía es un modo de 
comportamiento con fines estratégicos (Cepeda 2007). 


Culpeper (1996) ofrece la contraparte del modelo de Brown y Levinson (1987), si- 
guiendo firmemente los parámetros que establecen (Kaul de Marlangeon 2012). Así, 
enumera un conjunto de superestrategias, en oposición a las estrategias corteses: 


6 En este bloque distinguen entre cortesía positiva, si está orientada hacia la imagen positiva 
del oyente, y cortesía negativa, si está orientada hacia la imagen negativa del oyente. 
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Descortesía directa” (ataque claro y conciso). 

e Falsa cortesía (empleo de estrategias de cortesía, imposibilidad de atribuir inten- 
ción al hablante). 

e Descortesía encubierta (ataque implícito, el hablante no se muestra responsable 
del acto) (Culpeper 2016). 

e  Acortesía (ausencia de cortesía donde se requiere) (Culpeper 2016). 


Además, Culpeper (1996) diferencia entre actos directos y actos indirectos: 


1. Los actos directos incluyen técnicas que emplean términos con significados 
propiamente descorteses, que están convencionalizadas en un contexto especí- 
fico y con efectos perlocutivos concretos. 

2. Los actos indirectos se obtienen por derivación inferencial, mediante el contexto 
O la forma. 


Con esta teoría, pues, se defiende que los actos indirectos pueden incrementar la 
descortesía, pues se fuerza al oyente a un coste de procesamiento extra. 


Seguidamente, Culpeper (2011) determina la descortesía convencional y la divide 
en tres actos comunicativos, del más semántico al más contextual, por el tipo de 
inferencia que realiza el oyente: 


e Derivados por la forma (según el contenido semántico). 
Derivados por convención (según el contexto, parte del enunciado no está acorde 
con el resto). 

e Derivados por el contexto (mediante inferencia, según el conocimiento compar- 
tido). 


Culpeper explica que las inferencias derivadas del contexto son posibles gracias a 
su inserción en determinados contextos, que determina su significado y función: las 
implicaturas que se obtienen son resultado de la unión del acto verbal y el contexto 
en el que se realizan, más que al propio acto en sí. 


Finalmente, defiende que es posible la cancelación de la implicatura —tanto derivada 
por convención como derivada por el contexto—, ya que está en relación con lo mutua- 
mente manifiesto (Bell 1997), aunque revela la distancia contextual entre hablantes. 


7 Culpeper (1996) también distingue entre descortesía positiva y descortesía negativa, si- 
guiendo el modelo de Brown y Levinson (1987). 
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2.4 Entre la Descortesía y la Agresión 


Tradicionalmente la descortesía se ha vinculado a la violencia, y la agresión, al des- 
equilibrio de la armonía social. 


Bousfield y Locher (2008) clasifican la descortesía como una subcategoría de la agre- 
sión verbal en la que el enunciado es motivado por un sentimiento personal de rencor 
(“personal sense of spite”), en la que la intención no es expresada de manera clara. 


Proponen establecer una escala intencional con la que graduar la intención de atacar 
que permitiría la distinción y relación entre la agresión verbal, la descortesía y la 
zona intermedia. Con todo, Bousfield y Locher (2008) aceptan la descortesía como 
subcategoría de la agresión verbal. 


Terkourafi (2008), por su lado, afirma que tanto la cortesía como la descortesía no 
se realizan de manera directa porque con ellas se evalúa el comportamiento del 
hablante, y lo que determina si un acto fortalece o amenaza la imagen son sus efectos 
perlocutivos. Distingue, también, entre grosería implícita (convencional en relación 
al contexto), grosería explícita (no convencionalmente relacionada con el contexto) 
y descortesía (no convencionalmente relacionada con el contexto, ataca la imagen, 
pero no es posible atribuirle la intención al hablante). De este modo, lo que dife- 
rencia la descortesía de la grosería es que esta última sí que inherentemente daña la 
imagen. 


Sin embargo, Terkourafi (2008) afirma que, aunque las expresiones queden fijadas 
convencionalmente y se les atribuya determinado efecto perlocutivo, no siempre pro- 
ducirán ese efecto, sino que dependerá del hablante; todo ello hace menos fija la 
descortesía. 


2.5 Violencia y Lenguaje 


Vista como fuerza primaria y elemental en el ser humano (Bornhauser 2012), la 
violencia se entiende como un acto que atenta contra la libertad interior y exterior 
del individuo (Fuentes Rodríguez y Alcaide Lara 2009). Es un elemento propio de 
la cultura y de las relaciones sociales [Kolakowski 1999 (citado por Colín Rodea 
2011)]. 


La relación que la violencia mantiene con el lenguaje es destacada: conlleva la 
ejecución de un acto ilocutivo destinado a dar la imagen del interlocutor (Fuentes 
Rodríguez y Alcaide Lara 2008). La hostilidad de cualquier tipo de acto de habla 
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depende del contexto, del contenido y de la interpretación; es un tipo de compor- 
tamiento. 


No obstante, si se trata la violencia como descortesía extrema, los actos verbales 
solo se clasifican como violentos si son explícitos, aunque autores como Brenes Peña 
(2009a) defienden que la explicitud no garantiza descortesía. 


Las teorías tradicionales han considerado los actos descorteses como perlocutivos, 
pero, si se afirma que la descortesía, así como la violencia, es una estrategia para 
alcanzar un fin, necesariamente ha de considerarse la intencionalidad del emisor de 
realizar dicho acto. 


Por otro lado, los principios que regulan la descortesía están en evolución cons- 
tante (Fuentes Rodríguez y Alcaide Lara 2009), y el resultado es la variabilidad de 
parámetros en la categorización de la descortesía (como el cultural o el personal) 
(Balandrón Pazos 2004, citado por Brenes Peña 2009a). 


Los estudios sobre violencia, descortesía y lenguaje son heterogéneos: según el autor, 
la agresión se distingue de la violencia, pero no la violencia de la descortesía ni la 
descortesía de la agresión (Fuentes Rodríguez y Alcaide Lara 2009; Blas Arroyo 
2010; Fuentes Rodríguez 2010; Mancera Rueda 2015; Brenes Peña 2009b). En ge- 
neral, no quedan establecidos unos límites claros: se puede tomar en consideración 
la intención, el fin (Balandrón Pazos 2004) o el grado de lesión (Kaul de Marlangeon 
2008), por ejemplo. 


2.6 Redes Sociales 


Por su particularidad, las redes sociales conforman un contexto distinto al de la co- 
municación oral: el canal, la distancia temporal entre hablantes y la información 
contextual son distintos (Díaz Pérez 2014). 


En Internet y, sobre todo, en las redes sociales encontramos un tipo de comunicación 
que no puede clasificarse ni de oral ni de escrita; se trata de un híbrido de ambas, —un 
texto oralizado, en términos de Yus (2010)- que Crystal (2002: 62) denomina Net- 
speak, “lenguaje escrito que se ha estirado en dirección al habla”. Es la gente quien 
influye de forma creativa en este lenguaje virtual, renegocian los géneros a través de 
la interacción social (Pano Alamán y Mancera Rueda 2014a; Iglesias Moreno 2012). 


Además, la temporalidad, el ritmo, la no respuesta inmediata y el paralenguaje di- 
fieren de los de la comunicación cara a cara (Lambert Graham 2008). Aun así, el 
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contexto virtual ofrece unas variables de interpretación distintas, pero igual de fruc- 
tíferas, tales como emoticonos o recursos tipográficos. 


El registro más frecuente es el coloquial y, pese a ser tecleado, no se presta la atención 
ni se realiza la revisión exhaustiva propia del texto escrito. Se trata de un texto escrito 
“sin filtro”, “improvisado”, pero que, a su vez, goza de una planificación previa: 
aparentemente es natural, pero el usuario, antes de emitir —o publicar— el enunciado 


ha podido leerlo y revisarlo (Mancera Rueda 2015). 


¿Descortesía en Internet? 


Las características del mundo virtual crean un contexto en el que la no proximidad 
personal lleva a la desinhibición y a la liberación de la responsabilidad de la ofensa 
o el ataque. No es de extrañar que abunde la descortesía, pero no se ha de relacionar 
con la violencia. El fin es, en gran medida, lúdico y de afiliación (Díaz Pérez 2014), 
de afianzamiento del vínculo de los receptores, que queda marcado, sobre todo, en 
el Retuit o el Me gusta. 


La temática del momento —derivada, sobre todo, de noticias que causan agitación— 
es otro de los factores que encaminan a los usuarios a la descortesía y a la agresión: 
es común hallarla en temas políticos e ideológicos (Vivas Márquez y Ridao Rodrigo 
2015). 


Así, parece claro que Facebook y Twitter son espacios favorables tanto para la des- 
cortesía —puesto que suponen una libertad expresiva y un mecanismo de desfogue 
emocional- como para la agresión —ya que se trata de un mundo ficticio y virtual que 
parece despersonalizar cualquier acción-. 


3 Violencia Lingúiística: Propuesta de Clasificación 


Debido a la variedad de criterios considerados en las diferentes clasificaciones de 
violencia lingúística, hemos creído oportuno establecer una propuesta de clasifi- 
cación para realizar el análisis (Figura 1). 


Los dos extremos que conforman el continuum son la grosería y la agresión. Ambas 
se consideran actos violentos en diferente grado: la grosería ataca únicamente la 
imagen del hablante; la agresión, la imagen del hablante y la del oyente. De esta 
manera, la agresión se concibe como el grado máximo de violencia y la grosería, 
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serías ción lización 
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Fig. 1. Continuum de Violencia. 


como el mínimo, formando así un continuum con diferentes niveles/grados entre 
ambos: desaprobación, ridiculización, rechazo y discriminación, insulto y amenaza. 


Los parámetros que distinguen grosería y agresión son la variabilidad y la genera- 
lidad: la grosería varía entre culturas, contextos e interlocutores —se caracteriza por 
la subjetividad (Lambert Graham 2008)-, mientras que la agresión es tomada ge- 
neralmente como tal en cualquier situación y por cualquier hablante (salvo alguna 
excepción). La grosería supone la transgresión de las normas de conducta cultural- 
mente establecidas y esperadas por los hablantes en cualquier situación. La agresión 
es la exteriorización de la agresividad como ataque al interlocutor 


Ambos extremos son intencionales, el contexto de las redes sociales favorece la per- 
cepción intencional (lenguaje escrito y leído simultáneamente), aunque, respecto a la 
grosería, la permisibilidad de la mala educación varía entre culturas y clases sociales. 


Desde una perspectiva lingúística, se tiene en cuenta que los actos violentos, como 
actos de habla, se pueden realizar de forma explícita o implícita, distinguiendo, así, 
tres niveles en los que hallar el contenido violento: el contenido violento inferido 
por la forma, que presenta el mayor grado de explicitud; el contenido inferido por el 
contexto, que representa un grado intermedio; y, por último, la violencia inferida por 
convención (véase Culpeper 2011). 


Los recursos de las diversas categorías del continuum son varios y, en muchas oca- 
siones, compartidos en los actos lingilísticos violentos. Su uso es posible gracias 
al empleo las implicaturas conversacionales, las implicaturas convencionales y el 
conocimiento compartido, tanto cultural como tecnológico. 


Así, en una gradación de lo directo a lo indirecto, estos mecanismos son: 


Comparaciones 

Exageraciones 

Tronías 

Sarcasmo 

Interrogaciones y exclamaciones retóricas 


A DA 
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Explícito 


Inferido por la forma 


Inferido por el contexto 


L y | 


2 Inferido por convención + 


implícito 


Fig. 2. Gradación Explícito e Implícito. 


6. Voces de eco o descripciones. 


4 Categorías del Continuum de Violencia: Análisis 


Teniendo en cuenta la clasificación de violencia lingúística propuesta, hemos rea- 
lizado un análisis del corpus recopilado. 


4.1 Groserías 


El uso del lenguaje soez y de las palabras malsonantes, pese a ser visto en varias 
culturas como descortés (Culpeper 2011; Terkourafi 2008), se ha convertido en un 
hábito lingúístico, una especificidad idiomática de la cultura española como sím- 
bolo de libertad de expresión (Rius 2012). Por ello, su empleo ataca a la imagen 
del emisor, a quien se le atribuye mala educación. Su normalización junto al distan- 
ciamiento de internet facilita la interpretación del lenguaje soez como no amenazante 
para la imagen del oyente. 


La grosería se asocia a la defecación, la sexualidad y la digestión, considerán- 
dose como “sinónimo de vulgaridad” (Colín Rodea 2011: 12). El Diccionario de 
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la Lengua Española (2016) y el Diccionario CLAVE, por su lado, definen grosería 
como “descortesía, falta grande de atención y respeto” y “rusticidad, ignorancia”. 


La categoría de groserías incluye, pues, palabras malsonantes (coño, cojones, mierda,.... 
de las cuales muchas han perdido la correlación con el ámbito escatológico o sexual, 
fijándose como “tacos”: 


(1) Todos revueltos en la mierda. 
También incluye palabras tabúes u obscenas en determinada cultura (hostia, puta,.... $: 
(2) Hay q joderse el amiguismo q sale por cualquier sitio. 


Las expresiones relacionadas con el asco son el paso del lenguaje soez a la des- 
aprobación o desacuerdo, porque el efecto de “provocar asco” se relaciona con el 
ámbito escatológico y digestivo: 


(3) Las joyitas de Hmicrohembrismosson grandes eh, y con joyitas quiero decir ganas 
de vomitar. 


Aunque la grosería sea inherentemente marcada, se puede encontrar, con los recursos 
tipográficos al alcance, enunciados groseros indirectos en los que el término soez 
aparece atenuado —mediante juegos fonéticos o el empleo de símbolos tipográficos— 
como también enunciados indirectos simples, que se sirven de implicaturas derivadas 
del contexto: 


(4) Eso de que ++ LosHomosexualesPeganSIDA es una +¡$ %:) 
(5) Mi perro, paseando, me acaba de dar su opinión sobre el +CaraACaraL6. La he 
recogido con la bolsa y tirado a la papelera. 


Junto a los insultos, el lenguaje soez es una fuente de información sobre las conven- 
ciones y normas lingúísticas impuestas por los hablantes (Bernal Linnersand 2007). 


$ En nuestro corpus, los tacos “expresan emociones tales como la ira, la excitación y también 
actúan como refuerzo” (Rundblom 2013); estos términos muchas veces se complementan 
con el uso de otras estrategias como refuerzos expresivos. 
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4.2 Desaprobación 


La muestra de discrepancia con otros usuarios conlleva un grado de ataque a la ima- 
gen del receptor, pero la distancia entre usuarios y la libertad expresiva de internet 
atenúan el posible ataque. Aun así, la confrontación de ideas y opiniones fomenta las 
relaciones sociales y crea lazos positivos (Bravo 1999), y la cultura española [res- 
pecto a los suecos, por ejemplo (Fant 1989)] tolera grados elevados de desacuerdo. 


En el nivel de lo explícito, esta categoría incluye fórmulas (no apruebo), expresiones 
del efecto que produce determinado acto en el receptor (me sigue encendiendo) o 
juicios directos al usuario; se emplean implicaturas conversacionales y, por tanto, se 
obtiene el contenido mediante la derivación del contexto: 


(6) Vergiienza ajena de oír hablar al marido de la +pedroche +testoeslahostia solo 
sabe decir eso 

(7) Aparte de que lo veo una irresponsabilidad enorme ... Lo mejor de toso los twits 
es “soy torero por la gracia de Dios” Dudo mucho que a Dios le guste la manera de 
torturar toros que tienes 


El desacuerdo se puede expresar indirectamente, como se ha comentado, mediante 
implicaturas contextuales o conversacionales. En éstas se pueden observar expre- 
siones populares, reacciones del usuario frente a la acción y generalizaciones: 


(8) Con la que cae y ...+CompiYogui 
(9) Definitivamente, he perdido la esperanza en la humanidad +LosHomosexuale- 
sPeganSIDA 


El recurso más empleado en las expresiones de desacuerdo es el de los enunciados 
de eco (derivados del contexto), interpretaciones de un pensamiento de otra persona 
que informan de que el emisor tiene en mente lo que tal persona dijo y una determi- 
nada actitud hacia ello (Sperber y Wilson 1986): 


(10) Gensanta! Escuchar a Rajoy decirle a Sánchez que tiene un problema en los 
ojos. HCaraACaraL6 


Las ironías se incluyen en los enunciados de eco, aunque la actitud expresada en un 
enunciado irónico es siempre de rechazo o desaprobación (Sperber y Wilson 1986); 
no es necesario elementos explícitos que marquen la actitud hacia el pensamiento 
descrito: 
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(11) *LosHomosexualesPeganSIDA y catarros. Y ojo cuidado con los catarros. 


Las comparaciones y las interrogaciones retóricas también son numerosas en nues- 
tro corpus. Las primeras, equiparan la situación con otra con la que comparte el ele- 
mento que se desea criticar; en las interrogaciones retóricas se formula una pregunta 
cuya respuesta sería de negación, mostrando sorpresa y discrepancia: 


(12) ttmicromachismos “Chicas no dejéis que los novios controlen vuestro teléfono.” 
Soraya Sáenz de S. María. ¿La responsabilidad de la mujer.? 


En la zona de lo implícito, finalmente, se encuentran las descripciones, enunciados 
que definen el elemento que se critica cuyo desacuerdo se infiere por la perspectiva 
que toma el emisor en la descripción: 


(13) Gente aplaudiendo como una persona agrede por la espalda a otro que no se lo 
espera. H+PuñetazoARajoy 


La discrepancia junto al ataque a la imagen explícito se materializa en la ridi- 
culización. 


4.3 Ridiculizaciones 


La ridiculización supone un grado más que las anteriores categorías en el continuum 
de violencia lingiística, porque implica de forma evidente un ataque a la imagen 
—positiva—del oyente; la ofensa es segura. 


El ridículo es definido por el Diccionario Salamanca de la lengua española (2006) 
como “algo que por su rareza o extravagancia mueve o puede mover a risa”, mar- 
cadamente peyorativo, porque “provoca o puede provocar la burla de los demás”. 


El uso del humor como herramienta de destrucción de la imagen del interlocutor 
(Bañón 2010) se ejemplifica en las ridiculizaciones: las burlas, asociadas al humor, 
atacan de forma clara la imagen —pública sobre todo-— del interlocutor. 


(14) fran Rivera es tauromaquiavelico 


Del mismo modo que en las comparaciones, se asocia a la persona con determi- 
nada situación cómica o bien resaltando determinado aspecto de manera burlesca, de 
modo que denotan cualidad contrarias a las que cabría esperar. En muchos casos, la 
ridiculización se deriva mediante la inferencia de implicaturas contextuales: 
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(15) Es una intelectual del siglo XXIT (si si lo he dicho bien) es una avanzada a 
su tiempo, una obra maestra, a su lado Mozart y Salieri son meros aprendices Una 
letra cargada de mensaje, e hace reflexionar ¿De dónde venimos? ¿A dónde vamos? 
¿Quiénes somos? ¿Si le saco todo el plástico que lleva en el cuerpo me podré hacer 
un IronMan de juguete a tamaño real? 


En varios casos, los elementos de la comparación dependen de la cultura, de modo 
que la implicatura se infiere por convención (por ejemplo, el término colorear se 
asocia en la cultura española a la infancia): 


(16) Sanchez ya colorea sin salirse del borde. +CaraACaraL6 


Del mismo modo que en las expresiones de desacuerdo, en las ridiculizaciones es 
común también encontrar interrogaciones retóricas, pero en estos casos funcionan 
como mecanismo de comparación con situaciones dispares; en estas interrogaciones 
retóricas la comparación se hace de manera implícita, mediante la ambigiedad léxica 
o estructural (diera la cara, por ejemplo) o utilizando expresiones que forman parte 
de la cultura española: 


(17) ¿Te gustan los sueldos altos? Pues vas a cobrar +PuñetazoARajoy 
(18) ¿Los toreros no tienen madre que les diga que porque ++FranRiverase tire por un 
pozo no tienen que tirarse ellos? 


Son destacadas las ridiculizaciones que apelan a elementos de actualidad tecnoló- 
gica, tales como programas de humor, los ordenadores o los propios “memes”: 


(19) Rajoy error code ttCaraACaraL6 


(21) Que no han trucado la foto del puñetazo de Rajoy para q parezca peor, que la 
han editado en insta y han subido el contraste Hpunetazoarajoy 


Los recursos tipográficos se emplean, sobre todo, como ataque a la ortografía del 
usuario O para exagerar la pronunciación de forma marcada, en un tono ridículo: 


(22) HA ESTADO*** 


% Construcción multimedia que describe situaciones, ideas o pensamientos de forma cómica 
y burlesca; son características de las redes sociales. 
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Como muestra del componente cultural de la pronunciación y la entonación, el si- 
guiente ejemplo contiene varias ridiculizaciones con una pronunciación “españolizada” 
en inglés, que connota ignorancia, o exageradamente inglesa, que connota cursilería 

O arrogancia: 


(23) Con mis zapatos Manolo”s Puedo? Puedo?Porfi!!!! Yo también sé decir “Dar- 
ling osea”. 

(24) Of coursedear! Lo voy a a apuntar en mi agenda: después de Pilates y del 
masaje. Qué cool tía! 

(25) Al Senado porque yo lo valgo.Rabia, rabiña 

(26) Y el Brunch en ese sitio tan divino con esos camareros tan monísimos en La- 
gasca, OK? 

(27) Puedesssss! Churri, osssseaa, quedamos aána para el branxxx? (brunch) porfii- 
1111? 

(28) Anota en tu aipaz. Y luego me llamas desde tu aifon seis plas. Sí, sí, plas. 

(29) Pero el plas es mucho mejor que el plus, no lo dudes! No olvides que estudié en 
Quembrich! 

(30) Yo también tengo un iphone6. Y en cuanto me entero q algún contacto mio no 
tiene le bloqueo. 


Expresiones como “of course”, “Darling osea” o “Qué cool tía!” se asocian a per- 
sonas pijas o de alta clase social; otras como “rabia, rabiña”, “jopelines” o “porfiii1i”, 
niñez; y la pronunciación exagerada como “Oxfor” o “aifon seis plas”, cursilería y 
petulancia. Así, estos casos forman parte de las ridiculizaciones implícitas derivadas 


por convención. 


4.4 Rechazos y Discriminaciones 


El rechazo y desprecio al interlocutor supone un ataque directo a su imagen, tanto 
positiva como negativa. Se alude a la persona de forma marcada, a pesar de que los 
mensajes en internet están en realidad destinados a la colectividad (Vivas Márquez y 
Ridao Rodrigo 2015). Es común encontrar en estos enunciados groserías; el uso del 
lenguaje soez es empleado como recurso expresivo y, por tanto, aumenta el grado de 
exhortación: 


(31) Y ahora ya que se vayan por el mediterráneo a otro país, a tomar por culo de 
aqui. 
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En la zona de lo implícito, las comparaciones provocan distintos efectos según el 
elemento con el que se compare al sujeto —como sucede en la desaprobación y en la 
ridiculización-; en el siguiente ejemplo, se ridiculiza y menosprecia al usuario: 


(32) Pilar Rubio, el interés que me produce tu vida personal es igual al interés que 
muestro por la reproducción del percebe. *SospechaEH 


Las interrogaciones retóricas expresan de forma indirecta el descontento del usuario 
en relación a determinada acción o al sujeto que la realiza, y el sarcasmo, “burla san- 
grienta, ironía mordaz y cruel con que se ofende o maltrata a alguien o algo” (como 
define el Diccionario de la Lengua Española) expresa, mediante un enunciado en 
eco, el desacuerdo y rechazo, cuyo fin es inherentemente ofensivo, a diferencia de la 
ironía. 


(33) no sabia que los reyes tienen amigos tan rinbonbantes, por dios hasta cuando 
(34) por favor no quiteis por asuntos terroristas myhyva la juventud iberica que se 
despierta a lal para verlo y se vuelve acostar hasta la cena. 


Las discriminaciones, las acciones que dan “trato desigual a una persona o colec- 
tividad por motivos raciales, religiosos, políticos, de sexo, etc.”, como define el Dic- 
cionario de la Lengua Española, conllevan un rechazo grupal, que supone un ataque 
a la imagen positiva y negativa de cada uno de los integrantes del grupo. 


En las discriminaciones implícitas derivadas por convención destacan las ova- 
ciones a personajes o acontecimientos históricos que fueron contrarios a las personas 
—0 grupos-— que se rechazan o discriminan. Los personajes y hechos históricos a los 
que se alude, además de ser inherentemente discriminatorios, se asocian a actos físi- 
camente violentos, hecho que incrementa la violencia del enunciado. 


(35) Gitanos un trabajo que le quedo pendiente al Canciller aleman. 
(36) Robespierrevuelvece! 


Los enunciados de eco en las discriminaciones están generalmente asociados a deter- 
minados grupos sociales, comunes en enunciados xenófobos y machistas. En muchos 
de los ejemplos en los que se emplea este recurso se altera el sujeto, de modo que, 
además de discriminar, se ridiculiza al usuario: 


(37) mi jefe me dijo el otro día que me afeitase la barba. A ninguna de mis com- 
pañeras le ha pasado. *tmicromachismos 
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En el caso de la discriminación por sexo, muchos de los enunciados contienen 
groserías, lo que incrementa el rechazo, denigrando al sexo al que se ataca: 


(38) Ojalá darle un pollazo en la frente a cada uno, por la cosa de la igualdad. Stop 
fimicromachismos. 


4.5 Insultos y Amenazas 


Los insultos y las amenazas conllevan un ataque directo a la imagen del interlocutor: 
los insultos atacan a la imagen positiva; las amenazas, a la imagen negativa. Esta es 
la principal distinción, pues el grado de violencia es el mismo: cerca del máximo. 


Los rasgos que caracterizan a los insultos son la oralidad —traducida por escrito con 
diacríticos, mayúsculas, puntos suspensivos e interjecciones—, la ambigiedad bus- 
cada intencionalmente por el hablante, la inestabilidad y sincronismo, y la gradación, 
sujeta a las acepciones y estructuras en las que se encuentran (Bernal Linnersand 
2007). 


Componentes de los insultos que son inherentes a la violencia son la salud (véase 
Campos Santelices 2010) y los derechos humanos. Se atacan las capacidades hu- 
manas del individuo (inteligencia, sexualidad, educación), así como aspectos rela- 
tivos, rasgos que se consideran positivos (bondad, sinceridad, respeto): 


(39) SOIS UNA PUTA ESCORIA +MYHYV 

(40) eres una troll o eres una auténtica retrasada. No sé porqué, pero me da por lo 
segundo ... 

(41) Vale, vale, tomamos nota realeza. Realeza o mentireza!! 


Las generalizaciones, mediante implicaturas conversacionales, conllevan un distan- 
ciamiento del emisor con el enunciado y el insulto, y las acusaciones conllevan la 
asociación de una etiqueta o característica que, en la mayoría de casos, es un insulto. 
Se trata de insultos cuya interpretación se deriva del contexto, en los que la etiqueta 
no marcada hace que el emisor eluda responsabilidad en el acto. 


(42) LosHomosexualesPeganSIDA si tirases una piedra en este hastag encontrarías 
20 subnormales por m2? 
(43) *LosHomosexualesPeganSIDA ¿Qué narices? La Iglesia Católica tiene dema- 


siado acceso a Twitter! 
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Entre las técnicas que se emplean para insultar, las que ocupan un mayor número de 
ejemplos en el corpus analizado son la ironía, el sarcasmo y las comparaciones: 


(44) Lo reconozco, no me dice nada nuevo este nuevo debate entre Cánovas y Sagasta 
tCaraACaraL6 

(45) Prefiero ver el bebé en brazos de Fran Rivera toreando, que de tropezón en un 
gintónic de Rita Barberá 


(46) Me encanta el retraso que tenéis. +LosHomosexualesPeganSIDA 
También se utilizan chistes, entre los que pueden incluirse las canciones populares: 


(47) Ande andeande País de Pandereta Ande andeande Que no tienen JETAAA 
ttCaraACaraLó6 ttCaraACaraTVE 


Los recursos tipográficos (pronunciación exagerada, puntos suspensivos y otros) son 
un mecanismo de mitigación que “esconden”, en lo implícito, el insulto (como se ha 
visto, también se emplean en el lenguaje soez y las ridiculizaciones): 


(48) Pero que se puede esperar de “gente” que ve programas como +Myhyv? 
(49) Espero k mañana no kiten mueres y omvres y bisevelsajolinkon los atentaos ke 
pesaos los lokos estos Hmyhyv 


Los insultos más indirectos son los que apelan al conocimiento compartido (deriva- 
dos por convención), inferidos, así, mediante implicaturas convencionales y cultu- 
rales: 


(50) Lo dicho, hoy Darwin se tendría que tomar un Valium. 
(51) Fran Rivera el que lo lea ... 


La violencia de estos enunciados se percibe solo si se tiene conocimiento de estos 
aspectos, por tanto, es relativa, mientras que el insulto directo contiene una inter- 
pretación peyorativa general (pese a la relatividad cultural). 


La percepción de los insultos, con todo, varía en función del contexto; en las re- 
des sociales —en los hashtags y publicaciones de grupos investigados—, debido a la 
distancia y el desconocimiento de usuarios, el insulto se percibe como un ataque. 


Las amenazas se definen como “el anuncio al receptor de nuestra voluntad de llevar 
a cabo o ejecutar en un tiempo futuro más o menos próximo un acto o acción que 
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supone un daño hacia su persona” (Brenes Peña 2009c). Atacan a la imagen negativa 
del interlocutor, aunque suelen ir acompañadas de ataques a la imagen positiva, de 
insultos, y apelan a la violencia física de forma explícita: 


citroen y luego en la mutua por parte de los psicologos y luego en la inspeccion- 
medika hijos de puta todos eniaisketemrinar todos colgados en la puerta de 1 sol de 


blikos —un beso compi yogui hay que ser subnormal puta sifilitika de mierda ke no 
te vea como rajoy por pontevedra o asutriaske vas a chupar igual kerajoy ......... 


El emisor, en las amenazas indirectas, elude la responsabilidad del acto y puede que 
no se dirija directamente al sujeto en cuestión: 


(53) Si queréis acabar con el bipartidismo, pasadme las coordenadas del plató. 
fCaraACaraL6 


Dentro de las amenazas, las maldiciones, deseos de sufrimiento y daño hacia el inter- 
locutor son una forma atenuada de amenaza, en la que el interlocutor no se incluye 
como actante en la acción violenta —en analogía con las acusaciones y los insultos—. 
Las maldiciones pueden realizarse mediante el uso del subjuntivo (por ejemplo, con 
la expresión desiderativa ojalá) o bien con el empleo del indicativo (por ejemplo, 
con la afirmación de que el dolor que se impreca acaecerá): 


(54) No es más tonto por q el día no es más largo. Ojalá se reuna pronto con su dios 
q menudo padre protector esta echo el memo 

(55) Eres descpreciable Milaximenez te alegra de todo el mal de las personas ya 
te llegará el turno Htcampostelana Osalvameoficial 


Las amenazas y los insultos representan un grado elevado de violencia, atacan direc- 
tamente a la imagen positiva y negativa del destinatario. 


4.6 Agresión 


Tanto la muestra de acuerdo con una acción violenta físicamente como la invitación a 
que la acción se realice se incluyen en esta categoría, que recoge aquellas expresiones 
a favor de la agresión física. El ataque a la imagen del interlocutor es evidente. 
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Se observan ejemplos que aprueban de forma abierta la acción violenta, pero también 
es posible realizar dicha aprobación de forma indirecta (por ejemplo, con inferencias 
por el contexto): 


(56) A ver, relajaos ... que ha sido un golpe de nada. Pocos puñetazos recibe el señor 
ese con todo lo que ha liado! Hpunetazoarajoy 

(57) 1,5mL de “Hostión 300” a mano abierta, vía facial, tres veces al día; desayuno, 
comida y cena. En casos extremos (como es el caso), doblar la dosis a 3mL, dos 
tomas en desayuno , dos en la comida y dos en la cena. Repetir el tratamiento durante 


un año 


La diferencia de esta categoría con la de amenazas reside en que, en este caso, el 
emisor no se implica explícitamente en el desarrollo de la acción (con el empleo del 
subjuntivo, la 3“ persona del singular o la forma impersonal) y el destinatario, en 
varios casos, tampoco queda definido individualmente: 


(58) Entiendo que uno tuvo error de tipografia ... pero los ultimos 2 de arriba a abajo, 
izquierda a derecha, habría que golpearlos hasta que les deje de doler ... 


La apelación a noticias de actualidad, por ejemplo, caracteriza a los ejemplos de 
agresiones implícitas, de modo que, mediante implicaturas convencionales, cultu- 
rales o de actualidad, es posible comprender el significado violento: 

(59) Pena me da que los seguidores de *+myhyvno vayan en autocar 
Finalmente, en esta categoría es posible, también, hallar ejemplos en los que se em- 
plee la tipografía como recurso para expresar pronunciación marcada, escondiendo 


en lo implícito el acto violento al que se apela: 


(60) +CompiYoguicompi yogui compiyoguicomguiyopicomguillopi con guillopi 
con guilloti con guilloti na con guillotina 


Así las cosas, un acto marcadamente explícito y directo como es la agresión se puede 
realizar de manera implícita. 
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5 Consideraciones Finales 


5.1 Resultados 


El objetivo principal de este trabajo ha sido analizar la violencia lingilística y para 
ello nos hemos servido de un corpus extraído de las redes sociales. Los objetivos que 
nos planteábamos eran los siguientes: 


Averiguar cómo se establece la relación entre la violencia y el lenguaje. 
Establecer distintos grados de violencia lingiística. 

Determinar qué características poseen los enunciados violentos. 

Analizar las técnicas empleadas en las redes sociales en la emisión de enunciados 
violentos 

e Indicar los tipos de actos violentos que predominan en las redes 


La teoría de los actos de habla afirma que hablar es realizar un tipo concreto de acto, 
de modo que es posible actuar violentamente al hablar. El hecho de que el corpus 
propio analizado se haya extraído de las redes sociales (plataformas virtuales en las 
que se interactúa principalmente con palabras) corrobora la existencia del acto de 
habla violento. 


La teoría de la cortesía muestra cómo los actos de habla pueden —de entre otras 
acciones— eliminar lazos sociales; por tanto, confirma la idea de violencia en el 
lenguaje que se plasma en la teoría de la descortesía. 


Teniendo en cuenta que la bibliografía sobre violencia lingúística no presenta un cri- 
terio uniforme para su clasificación, hemos propuesto nuestra propia clasificación de 
actos violentos. Esta clasificación incluye diferentes tipos de actos violentos según el 
grado de violencia, considerando el ataque a la imagen del emisor y del interlocutor. 


La teoría de la relevancia se ha empleado para sustentar la afirmación de que las 
categorías de nuestra clasificación pueden realizarse de forma explícita e implícita. 


Se aprecia que, salvo en la categoría de groserías, las demás categorías propuestas 
recurren al significado implícito para transmitir el contenido violento. 


e La categoría que presenta mayor contraste entre explícito e implícito es la de 
ridiculizaciones. Son generalmente comparativas y, en la mayoría de casos, hu- 
morísticas (96%). 


; TRIANGLE e Volume 14 e 2016 e DOI: 10.17345/triangle14 e ISSN: 2013-939X 


Violencia Lingúística en las Redes Sociales 61 


| 26 IMPLÍCITAS 
a RN | % EXPLÍCITAS 
o) 
E ES í 
o ¿O IM % EXPLÍCITAS 
S 2 
ES] $ a 
Y ES 1 % IMPLÍCITAS 
mue [Rechazos y 
. ¡Desacuerd [Ridiculizaci_.... e 
Groserías Discrimina| Insultos | Amenazas | Agresión 
os ones pS 
ciones 
E % EXPLÍCITAS 83 39 - | 19 35 29 57 
1 % IMPLÍCITAS 7 61 96 | 81 65 El 43 


Fig. 3. Categorías de Violencia. Explicitud e Implicitud. 


La segunda categoría con mayor porcentaje de ejemplos implícitos es la de re- 
chazos y discriminaciones (81%); éstos apelan al conocimiento histórico, como 
en el caso de la monarquía y el racismo, y al conocimiento del mundo en general, 
como en el caso del machismo. 

En los insultos, pese a la mayor presencia de formas explícitas respecto a las 
ridiculizaciones, abundan los enunciados con violencia implícita que se sirven 
de las implicaturas contextuales; aunque aparezcan insultos marcados como ¡m- 
bécil o gilipollas (35%), son más comunes los enunciados como Se te ha caído 
el cerebro (65%). Lo implícito de los insultos se puede deber a que los casos ex- 
traídos pertenecen a grupos (en el caso de Facebook) o bien a hashtags con gran 
número de tuits; por tanto, la generalización o el uso de implicaturas contextuales 
distancia al emisor del enunciado, lo que atenúa el insulto directo al interlocu- 
tor (en estos casos es desconocido). Las generalizaciones también tienen fuerte 
presencia en los insultos (15%), lo que incrementa el número de casos implícitos. 
Los desacuerdos o desaprobaciones no muestran tanto contraste como las otras 
categorías (39% explícitos y 61% de implícitos); sin embargo, aparecen fre- 
cuentemente exclamaciones e interrogaciones retóricas. 

En las amenazas también se observa una diferencia sustancial entre casos direc- 
tos e indirectos (31% explícitas y 69% implícitas): los enunciados con violencia 
implícita expresan el deseo de realizar la acción violenta en un futuro, pero no se 
explicita, como en la fórmula marcada de amenaza (X va a acción violenta a Y). 
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e Las agresiones es la categoría con menor contraste: posee un total de 43% de 
casos implícitos. Aunque en gran parte de los casos se trata de enunciados que 
apoyan acciones violentas, la agresión aparece explicitada en más de la mitad de 
los enunciados analizados (57%). 

e Las groserías, por último, a causa de su forma generalmente marcada, presenta 
el caso inverso: mayor número de ejemplos explícitos (83%). 


Brown y Levinson (1987) y Culpeper (1996) presentan en sus teorías diferentes es- 
trategias lingúísticas de cortesía, por un lado, y de descortesía, por otro lado. En la 
propuesta realizada en este trabajo se han examinado las estrategias de las distintas 
categorías de violencia lingiística, mediante las cuales se realiza el acto verbal. Tras 
el análisis del corpus, se observa que los recursos más empleados en las diferentes 
categorías son dispares, como muestra la Tabla 1. 


Cada categoría posee tres recursos, pues se ha tomado la distinción realizada por 
Culpeper (1996) de gradación de explícito a implícito: inferencia por la forma, infe- 
rencia por el contexto e inferencia por convención. 


Como muestra la Tabla 1: 


e Conforme aumenta el grado de violencia lingilística, aumenta el grado de im- 
plícito de los enunciados: las categorías de groserías o desacuerdos y desaproba- 
ciones se sirven de implicaturas contextuales, y las amenazas apelan al conoci- 
miento compartido. El caso de la agresión es particular (es necesario dar indicios 
para referirse a una agresión física), pero también, en varios enunciados, se alude 
a noticias de agresiones físicas (por ejemplo, el puñetazo a Rajoy). 

e En los insultos, debido a su componente cultural, es lógico que la estrategia de 
insulto implícito sea la generalización o insultos inferidos por el contexto lingiís- 
tico. 

e Es particular el caso de las ridiculizaciones, la categoría que presenta mayor 
caso de números implícitos, cuyo recurso más numeroso es la comparación, con 
personajes o acciones de actualidad, y, concretamente, el empleo de enunciados 
de eco. 


Teniendo en cuenta que determinados actos de habla amenazan a la imagen y que los 
actos de habla descorteses tienen la intención de agredir dicha imagen, parece lógico 
que la violencia lingúística esté presente en estas plataformas. La figura 4 muestra la 
presencia de las diversas categorías de violencia lingiística en las redes sociales, en 
general, y en el corpus analizado, en concreto. 
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Categoría Explícito implícito 
Inferido por la  Inferido por el Inferido por 
forma contexto convención 

Groserías Palabras Referencia al Alusión a 
malsonantes asco y los acciones 

efectos que escatológicas o 
provoca sexuales 

Desacuerdos y Expresión de Sensación de Interrogaciones 

Desaprobaciones desaprobación asco y y 

vergúenza exclamaciones 
Ridiculizaciones Risa Comparaciones  Enunciados de 
eco, 
enunciados 
infantiles 
Rechazos Exhortación Oraciones Expresión de 
sarcásticas hartazgo, 
enunciados de 
eco 

Insultos Disfemismos Generalizaciones Acusación de 

inconsciencia 

Amenazas Amenazar Explicitación del Referencia a 

deseo de dañar actos violentos 
físicamente al amenazantes 
interlocutor 

Agresión Alusión a Implicación no Exaltación de 
agresión física directa del agresiones 

emisor en el físicas 
acto violento 


Tabla 1. Categorías de Violencia y Estrategias. 


Ml Groserías 


Ml Desaprobaciones y 
Desacuerdos 


Ml Ridiculizaciones 


Mi Rechazos y 
Discriminaciones 


Ml insultos 


Fig. 4. Categorías de Violencia y su Presencia. 


Como se ha explicado, el insulto y la amenaza suponen el mismo grado de ataque, 
según si se ataca a la imagen positiva o a la negativa. Por ello, se han tomado por 
separado en el análisis del corpus. 
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En vista de los resultados que muestra la figura 4, se puede afirmar que la violen- 
cia lingiística está presente en diferentes grados; sin embargo, dicha presencia es 
desigual. Los resultados del análisis muestran que: 


e Las categorías de insultos y ridiculizaciones son las más presentes en el corpus 
analizado (35% y 26%, respectivamente). La afirmación de que, en las redes 
sociales, los fines que se persiguen con la violencia lingúística son la agresión, 
por un lado, y el alarde de ingenio, por otro (Díaz Pérez 2014), se confirma. 

e Las desaprobaciones o desacuerdos ocupan el tercer lugar (18%), hecho lógico a 
causa del uso de estas plataformas virtuales como medio de expresión —teniendo 
en cuenta las temáticas seleccionadas como fuente del corpus—. Sin embargo, 
esta libertad de expresión generalizada a veces se confunde con la falta de respeto 
y educación, que queda demostrada en los rechazos y discriminaciones (13%). 
Las características del medio —anonimato, distancia temporal y espacial, escasa 
información contextual—, por un lado, y las características de las redes sociales — 
plataforma social, imagen, perfil “manipulado”, interconexión entre varios usuar- 
10s simultáneamente—, por otro lado, favorecen este paso del desacuerdo al re- 
chazo. 

e Por último, las amenazas y las groserías, debido, quizá, a su esencial explici- 
tud, tienen presencia escasa en el corpus analizado (1% y 6%, respectivamente). 
Cabe mencionar que las groserías, en muchos casos (en un 31% del corpus), son 
empleadas como recurso expresivo, por lo que refuerzan la violencia. El caso de 
la agresión es escaso (1%), aunque presente, dato de especial interés teniendo en 
cuenta el no conocimiento entre los usuarios emisores del corpus de ejemplos. 


5.2 Conclusiones 


Tras el análisis y el estudio realizado, las conclusiones a las que llegamos son las 
siguientes: 


La violencia lingúística no es una, sino que comprende varias categorías graduables, 
pero todas ellas son violentas y, por tanto, atacan al interlocutor. La percepción de 
que únicamente los grados máximos de violencia (insultos, amenazas y agresión) 
son violencia propiamente dicha es, como queda demostrado, errónea; son varias las 
categorías que dañan la imagen del interlocutor, aunque el ataque sea de diferente 
grado. De hecho, el Código Penal condena el insulto y la amenaza (véase Código 
Penal, artículos 169, 170 y 171 para las amenazas, y artículo 208, para la injuria), 
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la discriminación, y la incitación al odio y la violencia contra grupos o asociaciones 
por motivos racistas, ideológicos o de enfermedad (artículo 510). 


Los recursos que se emplean para hablar violentamente son diversos y, en la mayoría 
de casos, apelan al conocimiento histórico, cultural y tecnológico. Cada categoría 
se materializa tanto explícita (inferido por la forma) como implícitamente (inferido 
por el contexto o por convención). En la mayoría de casos, la violencia lingúística 
pasa por materializarse de forma implícita. Sin embargo, si la prueba no es explícita, 
es decir, si el acto no es directo, no se considera delito. Teniendo en cuenta que es 
mucha más la violencia implícita que la explícita, cabría replantearse el considerar 
solamente los casos explícitos como actos de violencia, así como la necesidad de pre- 
sentar pruebas explícitas para poder denunciar (en el caso del maltrato psicológico, 
por ejemplo). 


En relación a las redes sociales, estas suponen un nuevo modo de comunicación, 
como también de relaciones sociales (poseen diferencias con las presenciales); por 
ende, se observa un nuevo contexto en el que aparece la violencia lingúística. Se 
observa una gran presencia de ataque a través de insultos y amenazas, de humor por 
medio de ridiculizaciones y de crítica mediante desacuerdo y desaprobaciones. Te- 
niendo en cuenta que la comunicación virtual es en gran parte lingúística y, particu- 
larmente, “escrita”, queda demostrado el importante peso de la violencia lingiística, 
poco considerada socialmente respecto a la violencia física. 


Al tratarse de plataformas sociales, en las que cada usuario posee una imagen “vir- 
tual”, se propicia el alarde de ingenio y, por tanto, los enunciados implícitos. Las 
ridiculizaciones, categoría “intermedia” en la clasificación propuesta, suponen una 
burla en presencia de miles de usuarios, lo que propicia el ciberacoso, pues, además, 
el testimonio escrito de la ridiculización “alarga” el ataque. También es necesario un 
planteamiento estricto que limite tanto las libertades de expresión como el respeto 
a los usuarios, sobre todo teniendo en cuenta el auge de las redes sociales entre los 
adolescentes. 


De especial interés es el hecho de que, pese al anonimato y la distancia social que 
presenta el mundo virtual, la violencia lingilística es en la mayor parte de los casos 
implícita; si en las relaciones virtuales, con mayor distancia y desconocimiento entre 
interlocutores, tiene más presencia la violencia lingilística en su vertiente implícita, 
es lógico que en las relaciones sociales cara a cara, dicha presencia sea todavía 
mayor. Todo ello lleva a reafirmar la necesidad de reflexionar sobre la explicitud 
requerida para considerar los casos de violencia como tales. 


En síntesis, el estudio y el análisis realizado demuestran que la violencia lingúística 
tiene el mismo peso que la violencia física; se sirve de otra forma de materialización, 
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pero la acción es la misma: violencia. En muchos casos es implícita y puede no ser 
percibida claramente, lo que favorece su incremento, y las redes sociales suponen 
un nuevo contexto en el que la violencia está presente y, en concreto, la lingiística. 
Queda demostrada la necesidad de cuestionar y observar los “vacíos legales” de estas 
nuevas formas de relaciones sociales. 
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